ubuntu16.04以deb包方式安装cuda9.0(pack

作者: 永兴呵呵哒 | 来源:发表于2018-08-25 13:20 被阅读0次

参考文章：https://docs.nvidia.com/cuda/archive/9.0/
参考文章：https://blog.csdn.net/QLULIBIN/article/details/78714596

前言
安装之前翻了好多博客，大都是先安装NVIDIA显卡驱动，然后是用run文件安装cuda，最后安装cudnn。自己采用这种方式安装期间，禁用了nouveau第三方驱动。这可能是导致安装完之后不能扩展显示屏的原因。所以自己重装了系统，采用deb文件安装cuda，在安装cuda期间自动安装了显卡驱动。啊啊啊啊啊，真的是比采用run文件安装简单了太多太多！，而且也可以使用扩展显示屏了！
一、安装ubuntu系统时的一些小问题
如果您在安装ubuntu16.04的过程中没有出现此问题，可以成功安装Ubuntu系统，请忽略此问题！
我是刚买的1060显卡的新电脑，可能是由于Ubuntu16.04自带的第三方显卡驱动Nouveau与英伟达显卡硬件不兼容的缘故，在安装时就会出现卡顿现象，然后出现安装界面进不去，或者关机卡死等问题。所以在开始安装时就要禁用该第三方显卡，安装ubuntu成功后，重新进入ubuntu系统时，也要禁用该第三方驱动，直到正确安装了对应的NVIDIA显卡驱动。
该命令就是：nomodeset
image.png 安装时，按字母e进入编辑，编辑前和编辑后，如下图。
image.png image.png 然后按F10保存进入安装。 image.png image.png image.png image.png 安装完成后进入系统时，按字母e进入编辑，编辑前和编辑后，如下图。 image.png image.png image.png 然后就可以正常进入ubuntu系统了，等安装好cuda和对应的显卡驱动之后，再也不用输入该命令了，ubuntu系统也不会卡死了。
二、安装cuda
1.官网下载deb包
Screenshot from 2018-08-25 10-58-50.png 2.前期准备工作
1）验证自己的电脑是否有一个可以支持CUDA的GPU
可以在电脑的配置信息中找到显卡的具体型号，如果你是双系统，在Windows下的设备管理器中也可以查到显卡的详细信息；也可以在ubuntu的终端中输入命令：

gs@gs:~$ lspci | grep -i nvidia

会显示出你的NVIDIA GPU版本信息，不过不是很详细。我的显示为：

01:00.0 VGA compatible controller: NVIDIA Corporation Device 1c20 (rev a1)

然后去CUDA的官网查看自己的GPU版本是否在CUDA的支持列表中。
2）验证自己的Linux版本是否支持 CUDA(Ubuntu 16.04没问题)
在终端中输入命令：

gs@gs:~$ uname -m && cat /etc/*release

结果显示为：

gs@gs:~$ uname -m && cat /etc/*release
x86_64
DISTRIB_ID=Ubuntu
DISTRIB_RELEASE=16.04
DISTRIB_CODENAME=xenial
DISTRIB_DESCRIPTION="Ubuntu 16.04.5 LTS"
NAME="Ubuntu"
VERSION="16.04.5 LTS (Xenial Xerus)"
ID=ubuntu
ID_LIKE=debian
PRETTY_NAME="Ubuntu 16.04.5 LTS"
VERSION_ID="16.04"
HOME_URL="http://www.ubuntu.com/"
SUPPORT_URL="http://help.ubuntu.com/"
BUG_REPORT_URL="http://bugs.launchpad.net/ubuntu/"
VERSION_CODENAME=xenial
UBUNTU_CODENAME=xenial
gs@gs:~$

3）验证系统是否安装了gcc
在终端中输入：

gs@gs:~$ gcc --version

结果显示：

gs@gs:~$ gcc --version
gcc (Ubuntu 5.4.0-6ubuntu1~16.04.10) 5.4.0 20160609
Copyright (C) 2015 Free Software Foundation, Inc.
This is free software; see the source for copying conditions.  There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.

若未安装请使用下列命令进行安装：

sudo apt-get  install  build-essential

4）验证系统是否安装了kernel header和 package development
a、查看正在运行的系统内核版本：
在终端中输入：

gs@gs:~$ uname -r

结果显示：

4.15.0-33-generic

b、在终端中输入：

gs@gs:~$ sudo apt-get install linux-headers-$(uname -r)

可以安装对应kernel版本的kernel header和package development
结果显示：

......
0 upgraded, 0 newly installed, 0 to remove and 0 not upgraded.

表示系统里已经有了，不用重复安装。
若以上各项验证检查均满足要求，便可进行下面的正式安装过程。如果没有满足要求的话，可以参考cuda的官方文档，里面有详细的针对每个问题的解决方案。
3.安装
使用cd命令进入到下载的deb包所在目录下，执行以下命令：

gs@gs:~/Desktop/ubuntu$  md5sum cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb

用MD5 检验，如果序号不和，得重新下载。
然后使用以下四条命令即可将cuda和对应的显卡驱动安装成功：

$ sudo dpkg -i cuda-repo-<distro>_<version>_<architecture>.deb
$ sudo apt-key add /var/cuda-repo-<version>/7fa2af80.pub
$ sudo apt-get update
$ sudo apt-get install cuda

重启电脑，检查Device Node Verification
执行：

$ ls /dev/nvidia*

结果显示

/dev/nvidia0  /dev/nvidiactl  /dev/nvidia-modeset  /dev/nvidia-uvm
或者
/dev/nvidia0      /dev/nvidiactl      /dev/nvidia-uvm

则安装成功。
4.设置环境变量
终端中输入

 $ sudo gedit /etc/profile

在打开的文件末尾，添加以下两行。
64位系统：

export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64\
                                                   ${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

32位系统：

export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}

export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib\
                                                   ${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

保存文件，并重启。因为source /etc/profile是临时生效，重启电脑才是永久生效。
这里有点与官方安装文档稍有不同，需要说明：
官方文档里说只需在终端中运行上述两条export语句即可，但如果不将它们不写入/etc/profile文件的话，这样的环境变量在你退出终端后就消失了，不起作用了，所以写入才是永久的做法。

重启电脑，检查上述的环境变量是否设置成功
a、验证驱动版本，在终端中输入以下命令：

$ cat /proc/driver/nvidia/version

结果显示

gs@gs:~$ cat /proc/driver/nvidia/version
NVRM version: NVIDIA UNIX x86_64 Kernel Module  384.130  Wed Mar 21 03:37:26 PDT 2018
GCC version:  gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.10)

b、验证CUDA Toolkit，在终端中输入以下命令：

$ nvcc -V

会输出CUDA的版本信息
如果是这样的：
The program 'nvcc' is currently not installed. You can install it by typing:
sudo apt-get install nvidia-cuda-toolkit
可能是环境配置没有成功，请重复上述步骤7）。

三、尝试编译cuda提供的例子
Screenshot from 2018-08-25 12-58-47.png

1）打开终端输入：

$ cuda-install-samples-9.0.sh <dir>  #<dir>是拷贝目录

我输入的是：

gs@gs:~$ cuda-install-samples-9.0.sh cuda_samples
#直接拷贝到我的Home目录下，文件名是cuda_samples，等编译完这个例子，这个文件夹就可以删掉了。

然后通过命令cd进入NVIDIA_CUDA-9.0_Samples目录：

gs@gs:~/cuda_samples/NVIDIA_CUDA-9.0_Samples$

然后在终端输入：

$ make

系统就会自动进入到编译过程，整个过程大概需要十几到二十分钟，请耐心等待。如果出现错误的话，系统会立即报错停止。
第一次运行时可能会报错，提示的错误信息可能会是系统中没有gcc，
解决办法就是通过命令重新安装gcc就行，在终端输入：$ sudo apt-get install gcc 安装完gcc后，再make就正常了。

如果编译成功，最后会显示Finished building CUDA samples，如下图所示。

image.png 然后运行编译生成的二进制文件。
编译后的二进制文件默认存放在NVIDIA_CUDA-9.0_Samples/bin中。
接着在上一个终端中输入：

$  cd /home/xxx/cuda_samples/NVIDIA_CUDA-9.0_Samples/bin/x86_64/linux/release       #其中xxx是你自己的用户名

然后在终端输入：

$ ./deviceQuery

结果如下图所示：看到类似如下图片中的显示，则代表CUDA安装且配置成功，其中 Result = PASS代表成功,若失败 Result = FAIL

image.png

最后再检查一下系统和CUDA-Capable device的连接情况
终端输入：

$ ./bandwidthTest

看到类似如下图片中的显示，则代表成功

image.png

证明，cuda安装成功并可以使用了！

四、安装cudnn
参考：
Screenshot from 2018-08-25 13-15-31.png 在cudnn官网上下载cudnn的tgz包，执行以下四条命令即可安装。

$ tar -xzvf cudnn-9.0-linux-x64-v7.tgz  #利用cd命令先进入到该文件所在目录下
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

cudnn安装成功。

网友评论

本文标题：ubuntu16.04以deb包方式安装cuda9.0(pack

本文链接：https://www.haomeiwen.com/subject/siwwiftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

ubuntu16.04以deb包方式安装cuda9.0(pack

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读