引言
借助 docker 方式安装的很多大型项目都需要使用 nvidia 显卡,在 docker 中使用 nvidia 显卡资源,一方面需要在 host 主机上安装 nvidia 驱动,另外还需要安装 nvidia-docker。整个系统架构如下图所示

本文总结了在 ubuntu 16.04 系统中 nvidia-docker 1.0 和 2.0 两个版本的安装方式。根据项目的不同要求,选择相应版本安装即可。
安装 nvidia-docker 1.0
- 添加 repo
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \
sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update
- 安装 nvidia-docker 1.0
sudo apt-get install nvidia-docker
安装 nvidia-docker 2.0
- 如果之前安装过 nvidia-docker 1.0 版本,要先删除
docker volume ls -q -f driver=nvidia-docker | xargs -r -I{} -n1 docker ps -q -a -f volume={} | xargs -r docker rm -f
sudo apt-get purge -y nvidia-docker
- 添加 repo (这一步与前边安装 v1.0 版本的设置完全相同)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update
- 安装 nvidia-docker 2.0 并加载相关配置文件
sudo apt-get install -y nvidia-docker2
sudo pkill -SIGHUP dockerd
- 测试是否安装成功
docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi
# 或者
docker run --runtime=nvidia --rm nvidia/cuda:9.0-base nvidia-smi
如果安装成功,应该可以正确显示本机的 nvidia 显卡信息。如果报错,先 docker login
,再运行上述命令。
网友评论