Ubuntu安装NVIDIA驱动,cuda,cudnn.
注意,安装哪个版本要事先查好,很多开发包并不支持最新版本的cuda. 比如:
tensorflow1.8只支持到cuda9.0.
官方链接
TensorFlow官方安装文档
pytorch官方安装文档
cuda官方安装文档
cuDNN官方文檔
安装包下载链接,下好对应版本的runfile备用:
nvida驱动下载
cuda下载
cuDNN下载
nvidia与cuda的版本兼容性
cuDNN与cuda的版本兼容性
cuDNN历史版本下载连接
cuda历史版本下载连接
非官方 tensorflow与cuda/cuDNN的版本兼容性
准备工作
- 卸载之前安装的驱动
sudo apt remove --purge nvidia*
- 禁用nouveau驱动
lsmod | grep nouveau
如果有输出,则代表nouveau正在运行, 需要我们手动禁掉nouveau
在Ubuntu16.04中,我们可以通过以下操作禁用nouveau:
创建文件 /etc/modprobe.d/blacklist-nouveau.conf 并在文件中写入内容
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
内容:
blacklist nouveau
options nouveau modeset=0
sudo update-initramfs -u
查看nouveau是否已经成功禁用
lsmod | grep nouveau
若无内容输出,则禁用成功;
若仍有内容输出,请检查上述操作,并重复;
操作无误但仍有输出,则可重启,进入用户登录界面时(不要登录进桌面),按Ctrl+Alt+F1进入字符终端界面,输入用户名和密码进行登录,登录成功后,再次查看
lsmod | grep nouveau
这时,我们已经成功禁用了nouveau,无输出
安装NVIDIA驱动
runfile安装(推荐)
# 进入命令行模式 ctrl+alt+F1 (~F6)
sudo service lightdm stop # 停止图形界面服务
sudo apt update
sudo apt install gcc-multilib # funfile安装方式依赖的包
sudo ./NVIDIA-Linux-x86_64-390.77.run
# 配置 x server
sudo nvidia-xconfig
apt安装(速度视安装源而定)
# 添加PPA
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
# 寻找合适的驱动版本
ubuntu-drivers devices
# 安装提示中 recommended 的
sudo apt install nvidia-396
重启,查看安装好了没
sudo service lightdm start # 开启图形界面服务
# ctrl+alt+F7 切换到图形界面
sudo reboot
nvidia-smi
sudo nvidia-settings
如果重启之后登录正常,没有出现循环登录进不去的情况,就成功了大半了,否则就是nouveau驱动禁止没有配好.
安装CUDA和cuDNN
安装cuda:
# 进入命令行模式 ctrl+alt+F1 (~F6)
sudo service lightdm stop # 停止图形界面服务
sudo chmod +x *.run
sudo ./cuda_9.0.176_384.81_linux.run
# 如果有补丁包,依次安装.
# 安装下面几个缺失的包
sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev
安装过程中询问要不要装驱动,否,因为已经装过了.其他选项默认即可, samples位置可以自己指定别的地方.
安装cuDNN:
tar -xzvf cudnn-9.0-linux-x64-v7.1.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
卸载cuda(如果装错了版本),脚本位于这样的位置:
/usr/local/cuda-9.2/bin/uninstall_cuda_9.2.pl
设置环境变量
sudo vim /etc/profile # 后面加入下面的变量导出
# cuda environment
export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64"
export PATH="$PATH:/usr/local/cuda/bin"
重新启动图形化界面
sudo service lightdm start
同时按住Alt + ctrl +F7,返回到图形化登录界面,输入密码登录。
如果能够成功登录,则表示不会遇到循环登录的问题,基本说明CUDA的安装成功了 .
验证安装
重启电脑
- 检查Device Node Verification
sudo reboot
ls /dev/nvidia*
若结果显示
/dev/nvidia0 /dev/nvidiactl /dev/nvidia-uvm
或显示出类似的信息,应该有三个(包含一个类似/dev/nvidia-num的),则安装成功。
- 检查toolkit
#检查 CUDA Toolkit是否安装成功
nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2017 NVIDIA Corporation
Built on Fri_Sep__1_21:08:03_CDT_2017
Cuda compilation tools, release 9.0, V9.0.176
- 验证驱动版本
#验证驱动版本
cat /proc/driver/nvidia/version
NVRM version: NVIDIA UNIX x86_64 Kernel Module 390.77 Tue Jul 10 18:28:52 PDT 2018
GCC version: gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.10)
网友评论