美文网首页
安装cuda+cudnn+pytorch环境

安装cuda+cudnn+pytorch环境

作者: Bing_o_o | 来源:发表于2019-10-18 13:23 被阅读0次

一、安装显卡驱动

  1. 首先添加ppa源
    sudo add-apt-repository ppa:graphics-drivers/ppa
  2. 更新一下
    sudo apt-get update

注意:如果BIOS有开启Secure Boot,建议先关闭再进行安装,否则可能出现秘钥验证问题

  1. 在System Settings -> Software & Updates -> Additional Drivers中选择适配的驱动,点击Apply Changes。如下图:


    image
  2. 重新启动
    sudo reboot
  3. 验证是否安装成功
    nvidia-smi
    如果输入后有显示显卡信息,则安装成功,如下图:
    image

二、安装cuda
先去官网https://developer.nvidia.com/cuda-downloads下载相应版本

微信截图_20191018131711.png
wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.243_418.87.00_linux.run

降低gcc&g++的版本(cuda10可支持gcc&g++7)
Ubuntu18.04默认安装的是gcc7&g++7,可通过输入以下代码查看版本

gcc --version 
g++ --version

cuda支持的版本很低,这里首先对gcc,g++降级,下载安装4.8版本

sudo apt-get install gcc-4.8  
sudo apt-get install g++-4.8 
cd /usr/bin 
sudo rm gcc
sudo ln -s gcc-4.8 gcc
sudo rm g++
sudo ln -s g++-4.8 g++

查看版本,如提示版本为4.8则成功

gcc --version
g++ --version

安装cuda:
sudo sh cuda_10.1.243_418.87.00_linux.run
安装时需要注意,有一个选项让是否安装显卡驱动,因为之前已经安装显卡驱动,所以不用选择安装
安装成功后,配置环境
sudo gedit ~/.bashrc
在文件的最后添加

  export PATH=/usr/local/cuda-10.1/bin${PATH:+:${PATH}}    
  export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}  

如果安装的不是CUDA10.1版本,更改cuda-10.1为自己安装版本即可

验证是否安装成功:

cd /usr/local/cuda/samples/1_Utilities/deviceQueryDrv
make
./deviceQueryDrv

三、安装cudnn
https://developer.nvidia.com/rdp/cudnn-archive下载相应版本

下载之前需要注册或登录nvidia账号,之后会填一个调查问卷,然后即可下载

下载后解压文件
tar -zxvf cudnn.tgz
然后将解压的文件复制到cuda-10.1目录下

sudo cp ./include/cudnn.h /usr/local/cuda-10.1/include
 
sudo cp ./lib64/libcudnn* /usr/local/cuda-10.1/lib64
 
sudo chmod a+r /usr/local/cuda-10.1/include/cudnn.h /usr/local/cuda-10.1/lib64/libcudnn*

四、安装pytorch
安装之前,先安装Anaconda软件,官网https://www.anaconda.com/download/下载相应版本安装即可
sudo sh anaconda.sh
打开官网https://pytorch.org/,可选择不同方式进行安装,推荐使用conda安装,安装时要注意选择cuda版本,然后根据下方相应命令安装即可

微信截图_20191018132116.png
conda install pytorch torchvision cudatoolkit=10.1 -c pytorch

安装好后检测cuda是否可用

import torch
torch.cuda.is_available()  #若为True表明没问题,False的话安装出现了问题

五、挂载机械硬盘到/home
因为主机有两块硬盘,一块是500G的固态硬盘,一块是4T的机械硬盘,考虑到服务器会分配给多个人使用,所以打算把4T的机械硬盘挂载到/home目录下,具体操作如下:

  1. 创建目录
    sudo mkdir /mnt/home
  2. 把/dev/sdb1挂载到/mnt/home
    sudo mount /dev/sdb1 /mnt/home
  3. 同步/home到/media/home,同步时间根据数据量大小决定,建议在系统空闲时操作
    sudo rsync -aXS /home/. /mnt/home/.
    备注:rsync非常耗时,耐心等待
  4. 取消/dev/sdb1挂载
    sudo umount /dev/sdb1
  5. 同步完成后重命名/home
    sudo mv /home /home_old
  6. 新建/home
    sudo mkdir /home
  7. 重新挂载/dev/sdb1到home
    sudo mount /dev/sdb1 /home
  8. 查看/dev/sdb1的UUID(可能需要超级用户权限)
    blkid
  9. 把UUID复制下来,修改/etc/fstab文件,实现开机自动挂载
sudo gedit /etc/fstab

# /home 4T
UUID=340f9349-ea51-4f71-ba4f-58d73e6fc739 /home ext4 nodev,nosuid 0 2 
  1. 保存之后重启系统,查看分区的挂载情况
    df –h
  2. 确认一切正常后删除/home_old

六、创建多用户登陆

sudo useradd -m liubin -s /bin/bash  # 创建用户
sudo passwd liubin  # 输入密码
sudo adduser liubin sudo  # 添加到超级用户组

七、内网穿透
参考这篇博客

https://www.jianshu.com/p/b7dca213ade9

八、关闭更新
由于Ubuntu的更新会导致内核更新从而Nvidia的驱动会不匹配,所以建议装完服务器后关闭更新

image
点击close关闭即可

九、安装net-tools和openssh-sever
这两个服务涉及到ip地址和ssh远程连接服务,必须安装

sudo apt install net-tools  # ifconfig查看ip地址
sudo apt install openssh-server

相关文章

网友评论

      本文标题:安装cuda+cudnn+pytorch环境

      本文链接:https://www.haomeiwen.com/subject/hjeimctx.html