在服务器上新装了CUDA,使用pytorch的时候出现了错误:
UserWarning: CUDA initialization: CUDA unknown error - this may be due to an incorrectly set up environment,
e.g. changing env variable CUDA_VISIBLE_DEVICES after program start. Setting the available devices to be zero.
(Triggered internally at /opt/conda/conda-bld/pytorch_1623448255797/work/c10/cuda/CUDAFunctions.cpp:115.)
return torch._C._cuda_getDeviceCount() > 0
首先检查显卡驱动,CUDA,cudnn,以及pytorch的版本是否匹配,如果不匹配,需要卸载之后重装对应的版本。
如果版本都是正确的,需要设置一下环境变量,输入sudo vim ~/.bashrc
,在最后加上:
# 前三行是安装CUDA的时候需要设置的
export PATH=/usr/local/cuda-11.2/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda-11.2/bin
export CUDA_VISIBLE_DEVICES=0,1,2,3
保存退出,试一下是否能够使用CUDA。
如果还是不行,输入apt-get install nvidia-modprobe
,应该就没有问题了。
如果依旧出现错误,全都卸了重装吧。
网友评论