奇怪的现象
之前在 Docker 跑pytorch一直没有问题,然后下载了一个paddle 镜像。
由于paddle镜像与我们自己的显卡 3090 不兼容,所以在docker 内部升级了 cuda 驱动。
然后所有的 docker 容器内,gpu 都是non_avaiable了。
在docker 内部执行 nvidia-smi, 能够看到显卡,但是 Cuda version 是N/A
升级的步骤
https://zhuanlan.zhihu.com/p/396292888, 基本上是follow 这里面的步骤。
然后这里选择了,安装驱动,460版本。
因为不选择这个,无法升级下去。
问题的原因
因为在docker 内部选择了按照驱动driver 460版本。会影响到物理机,而物理机之前的driver 是高于460的比如470 才能使用。
所以这个造成了显卡gpu 无法使用。
最终我们在物理机上升级了显卡驱动解决了问题。
如何避免docker 中更新driver
就是手动自己安装。不用连接里提到的方式
网友评论