美文网首页
安装cuda+cudnn+pytorch环境

安装cuda+cudnn+pytorch环境

作者: Bing_o_o | 来源:发表于2019-10-18 13:23 被阅读0次

    一、安装显卡驱动

    1. 首先添加ppa源
      sudo add-apt-repository ppa:graphics-drivers/ppa
    2. 更新一下
      sudo apt-get update

    注意:如果BIOS有开启Secure Boot,建议先关闭再进行安装,否则可能出现秘钥验证问题

    1. 在System Settings -> Software & Updates -> Additional Drivers中选择适配的驱动,点击Apply Changes。如下图:


      image
    2. 重新启动
      sudo reboot
    3. 验证是否安装成功
      nvidia-smi
      如果输入后有显示显卡信息,则安装成功,如下图:
      image

    二、安装cuda
    先去官网https://developer.nvidia.com/cuda-downloads下载相应版本

    微信截图_20191018131711.png
    wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.243_418.87.00_linux.run
    

    降低gcc&g++的版本(cuda10可支持gcc&g++7)
    Ubuntu18.04默认安装的是gcc7&g++7,可通过输入以下代码查看版本

    gcc --version 
    g++ --version
    

    cuda支持的版本很低,这里首先对gcc,g++降级,下载安装4.8版本

    sudo apt-get install gcc-4.8  
    sudo apt-get install g++-4.8 
    
    cd /usr/bin 
    sudo rm gcc
    sudo ln -s gcc-4.8 gcc
    sudo rm g++
    sudo ln -s g++-4.8 g++
    

    查看版本,如提示版本为4.8则成功

    gcc --version
    g++ --version
    

    安装cuda:
    sudo sh cuda_10.1.243_418.87.00_linux.run
    安装时需要注意,有一个选项让是否安装显卡驱动,因为之前已经安装显卡驱动,所以不用选择安装
    安装成功后,配置环境
    sudo gedit ~/.bashrc
    在文件的最后添加

      export PATH=/usr/local/cuda-10.1/bin${PATH:+:${PATH}}    
      export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}  
    

    如果安装的不是CUDA10.1版本,更改cuda-10.1为自己安装版本即可

    验证是否安装成功:

    cd /usr/local/cuda/samples/1_Utilities/deviceQueryDrv
    make
    ./deviceQueryDrv
    

    三、安装cudnn
    https://developer.nvidia.com/rdp/cudnn-archive下载相应版本

    下载之前需要注册或登录nvidia账号,之后会填一个调查问卷,然后即可下载

    下载后解压文件
    tar -zxvf cudnn.tgz
    然后将解压的文件复制到cuda-10.1目录下

    sudo cp ./include/cudnn.h /usr/local/cuda-10.1/include
     
    sudo cp ./lib64/libcudnn* /usr/local/cuda-10.1/lib64
     
    sudo chmod a+r /usr/local/cuda-10.1/include/cudnn.h /usr/local/cuda-10.1/lib64/libcudnn*
    

    四、安装pytorch
    安装之前,先安装Anaconda软件,官网https://www.anaconda.com/download/下载相应版本安装即可
    sudo sh anaconda.sh
    打开官网https://pytorch.org/,可选择不同方式进行安装,推荐使用conda安装,安装时要注意选择cuda版本,然后根据下方相应命令安装即可

    微信截图_20191018132116.png
    conda install pytorch torchvision cudatoolkit=10.1 -c pytorch
    

    安装好后检测cuda是否可用

    import torch
    torch.cuda.is_available()  #若为True表明没问题,False的话安装出现了问题
    

    五、挂载机械硬盘到/home
    因为主机有两块硬盘,一块是500G的固态硬盘,一块是4T的机械硬盘,考虑到服务器会分配给多个人使用,所以打算把4T的机械硬盘挂载到/home目录下,具体操作如下:

    1. 创建目录
      sudo mkdir /mnt/home
    2. 把/dev/sdb1挂载到/mnt/home
      sudo mount /dev/sdb1 /mnt/home
    3. 同步/home到/media/home,同步时间根据数据量大小决定,建议在系统空闲时操作
      sudo rsync -aXS /home/. /mnt/home/.
      备注:rsync非常耗时,耐心等待
    4. 取消/dev/sdb1挂载
      sudo umount /dev/sdb1
    5. 同步完成后重命名/home
      sudo mv /home /home_old
    6. 新建/home
      sudo mkdir /home
    7. 重新挂载/dev/sdb1到home
      sudo mount /dev/sdb1 /home
    8. 查看/dev/sdb1的UUID(可能需要超级用户权限)
      blkid
    9. 把UUID复制下来,修改/etc/fstab文件,实现开机自动挂载
    sudo gedit /etc/fstab
    
    # /home 4T
    UUID=340f9349-ea51-4f71-ba4f-58d73e6fc739 /home ext4 nodev,nosuid 0 2 
    
    1. 保存之后重启系统,查看分区的挂载情况
      df –h
    2. 确认一切正常后删除/home_old

    六、创建多用户登陆

    sudo useradd -m liubin -s /bin/bash  # 创建用户
    sudo passwd liubin  # 输入密码
    sudo adduser liubin sudo  # 添加到超级用户组
    

    七、内网穿透
    参考这篇博客

    https://www.jianshu.com/p/b7dca213ade9

    八、关闭更新
    由于Ubuntu的更新会导致内核更新从而Nvidia的驱动会不匹配,所以建议装完服务器后关闭更新

    image
    点击close关闭即可

    九、安装net-tools和openssh-sever
    这两个服务涉及到ip地址和ssh远程连接服务,必须安装

    sudo apt install net-tools  # ifconfig查看ip地址
    sudo apt install openssh-server
    

    相关文章

      网友评论

          本文标题:安装cuda+cudnn+pytorch环境

          本文链接:https://www.haomeiwen.com/subject/hjeimctx.html