美文网首页
tensorflow docker gpu 安装指南

tensorflow docker gpu 安装指南

作者: xo1988 | 来源:发表于2019-09-29 14:43 被阅读0次

    经常性的忘记怎么安装tensorflow docker gpu,方便重放操作

    参考文档:

    1. tensorflow官方文档
    2. docker-ce官方文档
    3. nvidia-docker官方文档

    环境: ubuntu16.04LTS
    由于使用nvidia-docker官方出品的docker镜像,就不需要安装烦人的cuda包了,之前每次搞这个都头大,只需要安装nvidia驱动就好了

    1. 首先查看有没有Nvidia显卡
    lspci | grep -i nvidia # 会列出显卡信息
    
    2. 安装nvidia驱动
    sudo mkdir /usr/lib/nvidia
    sudo apt-get install --no-install-recommends nvidia-410
    sudo reboot # 重启一下
    nvidia-smi # 查看驱动是否安装成功,如果成功了会显示信息
    
    3. 安装docker-ce
    sudo apt-get update
    sudo apt-get install \
        apt-transport-https \
        ca-certificates \
        curl \
        software-properties-common
    curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
    sudo add-apt-repository \
       "deb [arch=amd64] https://download.docker.com/linux/ubuntu \
       $(lsb_release -cs) \
       stable"
    sudo apt-get update
    sudo apt-get install docker-ce
    
    4. 安装nvidia-docker
    $ distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
    $ curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
    $ curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
    
    $ sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
    $ sudo systemctl restart docker
    

    比较奇怪的是nvidia-docker里边的测试写的是docker run加参数 --gpus all
    此时用tensorflow说明的用 docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi 验证会报错找不到nvidia,不过替换成 docker run --gpus all --rm nvidia/cuda nvidia-smi 是可以的,跑tf应用的时候GPU也会分配内存

    5. 拉镜像

    tensorflow的docker hub地址
    通过tag过滤查看自己想要的镜像,譬如说我想下载的是 2.0.0rc0-gpu-py3 体验一下

    docker pull tensorflow/tensorflow:2.0.0rc0-gpu-py3
    
    6. 镜像加速

    由于国内拉镜像可能会比较慢,因此最好配置一个国内镜像

    sudo mkdir -p /etc/docker
    sudo tee /etc/docker/daemon.json <<-'EOF'
    {
      "registry-mirrors": ["xxx"]
    }
    EOF
    sudo systemctl daemon-reload
    sudo systemctl restart docker
    

    其中镜像可选,其中阿里云需要有阿里云账户,搜索容器镜像服务,最后一项是镜像加速器里边能获得相应地址

    镜像加速器 镜像加速器地址
    Docker 中国官方镜像 https://registry.docker-cn.com
    DaoCloud 镜像站 http://f1361db2.m.daocloud.io
    Azure 中国镜像 https://dockerhub.azk8s.cn
    科大镜像站 https://docker.mirrors.ustc.edu.cn
    阿里云 https://<your_code>.mirror.aliyuncs.com
    七牛云 https://reg-mirror.qiniu.com
    网易云 https://hub-mirror.c.163.com
    腾讯云 https://mirror.ccs.tencentyun.com

    参考 https://blog.csdn.net/fxbin123/article/details/94882527

    接下来就可以尝鲜了~

    相关文章

      网友评论

          本文标题:tensorflow docker gpu 安装指南

          本文链接:https://www.haomeiwen.com/subject/jnpfpctx.html