docker配置深度学习环境是非常容易的,只需要装好nvidia驱动即可,cudann和cuda不需要装。
还有一个需要说明的是nvidia-docker2已经弃用,现在都是装nvidia-container-toolkit,具体看以下教程。
1.docker清除旧版本:
sudo apt-get remove docker docker-engine docker-ce docker.io
sudo rm -rf /var/lib/docker
dpkg -l | grep docker
sudo apt-get purge docker-ce
2.更新apt-get
apt-get update
3.安装添加使用 HTTPS 传输的软件包
sudo apt-get -y install apt-transport-https ca-certificates curl software-properties-common
4.添加软件源的GPG密钥---阿里源
curl -fsSL http://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg | sudo apt-key add -
sudo add-apt-repository "deb [arch=amd64] http://mirrors.aliyun.com/docker-ce/linux/ubuntu $(lsb_release -cs) stable"
5.更新apt-get,安装docker
apt-get update
sudo apt-get install docker-ce
6.查看docker版本
docker version
8.安装docker-nvidia
参考官方git https://github.com/NVIDIA/nvidia-docker
9.安装nvidia-container-runtime
https://github.com/nvidia/nvidia-container-runtime#environment-variables-oci-spec
最后编辑的daemon.json文件内容如下:
{
"runtimes": {
"nvidia": {
"default-runtime":"nvidia",
"path": "/usr/bin/nvidia-container-runtime",
"runtimeArgs": []
}
}
}
https://www.cnblogs.com/journeyonmyway/p/11234572.html
https://blog.csdn.net/Letitia96/article/details/102535600#2_nvidiadocker_12
distribution=IDdistribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
sudo systemctl restart docker
docker run --gpus all --rm nvidia/cuda:10.1-base nvidia-smi
cuda:后面要写自己的cuda版本
拉取deepo镜像
先配置镜像为阿里的镜像
sudo mkdir -p /etc/docker
sudo tee /etc/docker/daemon.json <<-'EOF'
{
"registry-mirrors": ["https://jlk8gx5v.mirror.aliyuncs.com"]
}
EOF
sudo systemctl daemon-reload
sudo systemctl restart docker
之后
docker pull ufoym/deepo
即可高速拉取镜像
docker run --runtime=nvidia -it --name mytest ufoym/deepo
网友评论