美文网首页
Ubuntu16安装Cuda9

Ubuntu16安装Cuda9

作者: 田丰w | 来源:发表于2018-07-29 22:09 被阅读0次

Ubuntu安装NVIDIA驱动,cuda,cudnn.

注意,安装哪个版本要事先查好,很多开发包并不支持最新版本的cuda. 比如:
tensorflow1.8只支持到cuda9.0.

官方链接

TensorFlow官方安装文档
pytorch官方安装文档
cuda官方安装文档
cuDNN官方文檔

安装包下载链接,下好对应版本的runfile备用:
nvida驱动下载
cuda下载
cuDNN下载

nvidia与cuda的版本兼容性
cuDNN与cuda的版本兼容性
cuDNN历史版本下载连接
cuda历史版本下载连接

非官方 tensorflow与cuda/cuDNN的版本兼容性

准备工作

  1. 卸载之前安装的驱动
sudo apt remove --purge nvidia*
  1. 禁用nouveau驱动
lsmod | grep nouveau

如果有输出,则代表nouveau正在运行, 需要我们手动禁掉nouveau
在Ubuntu16.04中,我们可以通过以下操作禁用nouveau:
创建文件 /etc/modprobe.d/blacklist-nouveau.conf 并在文件中写入内容
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
内容:

blacklist nouveau 
options nouveau modeset=0
sudo update-initramfs -u

查看nouveau是否已经成功禁用

lsmod | grep nouveau

若无内容输出,则禁用成功;
若仍有内容输出,请检查上述操作,并重复;
操作无误但仍有输出,则可重启,进入用户登录界面时(不要登录进桌面),按Ctrl+Alt+F1进入字符终端界面,输入用户名和密码进行登录,登录成功后,再次查看

lsmod | grep nouveau

这时,我们已经成功禁用了nouveau,无输出

安装NVIDIA驱动

runfile安装(推荐)

# 进入命令行模式 ctrl+alt+F1 (~F6)
sudo service lightdm stop    # 停止图形界面服务
sudo apt update
sudo apt install gcc-multilib    # funfile安装方式依赖的包
sudo ./NVIDIA-Linux-x86_64-390.77.run

# 配置 x server
sudo nvidia-xconfig

apt安装(速度视安装源而定)

# 添加PPA
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update

# 寻找合适的驱动版本
ubuntu-drivers devices

# 安装提示中 recommended 的
sudo apt install nvidia-396

重启,查看安装好了没

sudo service lightdm start    # 开启图形界面服务
# ctrl+alt+F7 切换到图形界面
sudo reboot
nvidia-smi
sudo nvidia-settings

如果重启之后登录正常,没有出现循环登录进不去的情况,就成功了大半了,否则就是nouveau驱动禁止没有配好.

安装CUDA和cuDNN

安装cuda:

# 进入命令行模式 ctrl+alt+F1 (~F6)
sudo service lightdm stop    # 停止图形界面服务
sudo chmod +x *.run
sudo ./cuda_9.0.176_384.81_linux.run
# 如果有补丁包,依次安装.
# 安装下面几个缺失的包
sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev

安装过程中询问要不要装驱动,否,因为已经装过了.其他选项默认即可, samples位置可以自己指定别的地方.

安装cuDNN:

tar -xzvf cudnn-9.0-linux-x64-v7.1.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

卸载cuda(如果装错了版本),脚本位于这样的位置:

/usr/local/cuda-9.2/bin/uninstall_cuda_9.2.pl

设置环境变量
sudo vim /etc/profile # 后面加入下面的变量导出

# cuda environment
export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64"
export PATH="$PATH:/usr/local/cuda/bin"

重新启动图形化界面

sudo service lightdm start

同时按住Alt + ctrl +F7,返回到图形化登录界面,输入密码登录。
如果能够成功登录,则表示不会遇到循环登录的问题,基本说明CUDA的安装成功了 .

验证安装

重启电脑

  1. 检查Device Node Verification
sudo reboot
ls /dev/nvidia*

若结果显示

/dev/nvidia0    /dev/nvidiactl    /dev/nvidia-uvm

或显示出类似的信息,应该有三个(包含一个类似/dev/nvidia-num的),则安装成功。

  1. 检查toolkit
#检查 CUDA Toolkit是否安装成功 
nvcc -V

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2017 NVIDIA Corporation
Built on Fri_Sep__1_21:08:03_CDT_2017
Cuda compilation tools, release 9.0, V9.0.176
  1. 验证驱动版本
#验证驱动版本
cat /proc/driver/nvidia/version

NVRM version: NVIDIA UNIX x86_64 Kernel Module  390.77  Tue Jul 10 18:28:52 PDT 2018
GCC version:  gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.10) 

参考:

Ubuntu16安装cuda9.1

相关文章

网友评论

      本文标题:Ubuntu16安装Cuda9

      本文链接:https://www.haomeiwen.com/subject/tfetvftx.html