美文网首页嵌牛IT观察
分布式机器学习(二)框架安装之NVIDIA驱动

分布式机器学习(二)框架安装之NVIDIA驱动

作者: Lontano_wjk | 来源:发表于2022-03-21 15:03 被阅读0次

    姓名:王佳昆

    学号:21011210148

    学院:通信工程学院

    【嵌牛导读】安装NVIDIA驱动

    【嵌牛鼻子】NVIDIA驱动

    【嵌牛提问】如何安装正确NVIDIA驱动?

    【嵌牛正文】

    1.安装NVIDIA驱动

            重复登录的问题是因为NVIDIA驱动版本和linux内核版本不匹配导致的,因为linux内核一直在更新,更新后可能不匹配。

            所以安装系统后选择不更新,也有命令,可以更新内核版本使得nvidia匹配。

    (1)查询NVIDIA驱动

            首先去官网(http://www.nvidia.com/Download/index.aspx?lang=en-us)查看适合自己显卡的驱动(下载runfile文件):

    2)安装驱动

    1、先按Ctrl + Alt + F1到控制台,关闭当前图形环境 


    $sudo service lightdm stop


    2、卸载可能存在的旧版本 nvidia 驱动


    $sudo apt-get remove --purge nvidia*


    3、安装驱动可能需要的依赖


    $sudo apt-get update

    $sudo apt-get install dkms build-essential linux-headers-generic


    把 nouveau 驱动加入黑名单并禁用用 nouveau 内核模块(如果新重装的系统,没有驱动起作用,忽略)


    $sudo nano /etc/modprobe.d/blacklist-nouveau.conf


    在文件 blacklist-nouveau.conf 中加入如下内容:


    blacklist nouveau

    options nouveau modeset=0


    保存退出,执行


    $sudo update-initramfs -u

    $sudo reboot #重启


    4、检查


    $uname -a 查看目前在用的内核版本

    $dpkg --get-selections|grep linux-image 显示所有的内核版本

    $sudo apt remove linux-image-XXXX-generic 卸载旧内核,注意只保留最新的 两个 版本

    $sudo apt autoremove 清理无用的依赖


    5、运行驱动安装文件

    重启后再次进入字符终端界面(Ctrl + Alt + F1),并关闭图形界面


    $sudo service lightdm stop


    安装驱动


    $sudo chmod u+x NVIDIA-Linux-x86_64-361.45.11.run

    $sudo ./NVIDIA-Linux-x86_64-361.45.11.run(sudo ./NVIDIA-Linux-x86_64-375.20.run –no-opengl-files)

    或 sudo ./NVIDIA-Linux-x86_64-375.20.run –no-x-check –no-nouveau-check –no-opengl-files


    注:kenel 不装选NO; X-config Yes

    最后重新启动图形环境


    $sudo service lightdm start


    可以通过以下命令确认驱动是否正确安装


    $cat /proc/driver/nvidia/version


    相关文章

      网友评论

        本文标题:分布式机器学习(二)框架安装之NVIDIA驱动

        本文链接:https://www.haomeiwen.com/subject/bsctjrtx.html