本来安装的是Ubuntu16.04+CUDA9.0结果后来要给linux kernel降级,系统给整崩溃了
重新安装索性安装了Ubuntu18.10,现在只有CUDA10.1支持
安装完全参考官方:https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html
1、部分检查过程,主要判断是否支持cuda,按照官方要求Ubuntu 18.10,支持kernel4.18.0和GCC8.2.0:
检查显卡
lspci | grep -i nvidia

检查系统,
uname -m && cat /etc/*release

检查gcc版本,我的没有安装过,直接安装的,默认8.2.0
gcc --version
检查内核版本
uname -r
这里是第一个坑爹的地方,因为CUDA对于linux的kernel要求比较严格,我检查出来的版本4.18.0-17-generic,我以为按照要求是符合的4.18.0的安装要求的,结果安装过程中还是出现了坑爹的kernel不支持,于是我看到系统还有另外一个4.18.0-10-generic,(这个可以进入/boot查看)于是直接删除了17版本的kernel(sudo apt-get remove linux-headers-4.18.0-17-generic linux-image-4.18.0-17-generic
),重新启动采用了10版本的kernel。
2、安装CUDA,这里推荐deb安装
(系统提示了两种安装方式,一种是deb安装方式,一种是runfile安装方式,runfile尝试n次未果,怀疑是SecureBoot相关,但是没有找到关闭方法)
1、下载dep
默认下载地址是https://developer.nvidia.com/cuda-downloads 默认下载是10.1的最新版本,如果要是变成了历史版本下载地址应该变为了 https://developer.nvidia.com/cuda-10.1-download-archive
依次选择linux、x86_64、Ubuntu、18.10选择deb(local)下载
2、进入下载地址,安装deb
sudo dpkg -i cuda-repo-ubuntu1810-10-1-local-10.1.105-418.39_1.0-1_amd64.deb
安装完成的时候会提示没有安装好key之类的,按照提示安装即可
sudo apt-key add /var/cuda-repo-10-1-local-10.1.105-418.39/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda-10-1
安装cuda10.1且不更新
这样就开始安装了,安装过程中提示了SecureBoot的密码设置,其他就确认好了
3、添加环境变量
export PATH=/usr/local/cuda-10.1/bin:/usr/local/cuda-10.1/NsightCompute-2019.1${PATH:+:${PATH}}
4、重启
reboot
终端输入 nvidia-smi不提示错误能正确现实一些显卡信息就没有问题了

网友评论