美文网首页
1、深度学习环境

1、深度学习环境

作者: 无须想 | 来源:发表于2020-05-10 10:45 被阅读0次

    1、查看显卡信息

    1)查看显卡信息:
    lspci | grep -i vga
    2)查看详细信息:
    lspci -v -s 02:00.0
    连接:https://blog.csdn.net/dcrmg/article/details/78146797
    

    2、概念图

    显卡: 简单理解这个就是我们前面说的GPU,尤其指NVIDIA公司生产的GPU系列,因为后面介绍的cuda,cudnn都是NVIDIA公司针对自身的GPU独家设计的。
    显卡驱动:很明显就是字面意思,通常指NVIDIA Driver,其实它就是一个驱动软件,而前面的显卡就是硬件。
    gpu架构:Tesla、Fermi、Kepler、Maxwell、Pascal
    芯片型号:GT200、GK210、GM104、GF104等
    显卡系列:GeForce、Quadro、Tesla
    GeForce显卡型号:G/GS、GT、GTS、GTX
    

    详细:
    [1] https://zhuanlan.zhihu.com/p/91334380
    [2] https://chenrudan.github.io/blog/2015/12/20/introductionofgpuhardware.html

    3、安装步骤

    1) 查看操作系统对应版本(uname -m && cat /etc/*release 或者 uname -a)
    
    2)安装nvidia驱动,下载对应版本的驱动并安装:sudo ./NVIDIA-Linux-x86_64-440.82.run
    
    3)若安装失败,可能需要安装对应的 kernel header 和 package development
    tips1: apt search linux-headers-$(uname -r) 有可能找不到对应版本的headers
    tips2: 需要到官网下载对应版本的linux-headers、headers-common、linux-kbuild 和 linux-compiler 进行安装
    tips3: 下载 wget http://snapshot.debian.org/archive/debian/20190205T032415Z/pool/main/l/linux/linux-headers-4.9.0-8-common_4.9.144-3_all.deb
    tips4: 安装 dpkg -i linux-headers-4.9.0-8-amd64_4.9.144-3_amd64.deb
    
    nvida 驱动卸载
    sudo /usr/bin/nvidia-uninstall
    cuda  卸载
    cd /usr/local/cuda/bin
    sudo ./cuda-uninstaller
    

    卸载:Ubuntu 16.04 卸载Nvidia显卡驱动和cuda
    注意版本要求:https://tensorflow.google.cn/install/source#linux

    版本.png

    4、

    安装 Anaconda3
    sudo bash Anaconda3-2020.02-Linux-x86_64.sh
    conda create -n Py36TF2.2 python=3.6 anaconda
    conda env remove -n tf2.2Py36
    conda remove --name python35 --all
    

    conda使用:Anaconda使用总结

    5、

    cudnn 安装:下载对应版本 cudnn-10.1-linux-x64-v7.6.4.38.tgz
    tar -xvf cudnn-10.1-linux-x64-v7.6.4.38.tgz
    sudo cp cuda/include/cudnn.h /usr/local/cuda-10.1/include/
    sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.1/lib64/
    sudo chmod a+r /usr/local/cuda-10.1/include/cudnn.h /usr/local/cuda-10.1/lib64/libcudnn*
    

    6、tf 安装请参考官网

    pip install --upgrade https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-2.2.0-cp36-cp36m-manylinux2010_x86_64.whl
    #pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow-gpu==2.2.0
    Verify the install: 
    python -c "import tensorflow as tf;print(tf.reduce_sum(tf.random.normal([1000, 1000])))"
    

    7、jupyter notebook 添加 conda 环境

    nohup jupyter notebook > /dev/null 2>&1 &
    conda install ipykernel
    python -m ipykernel install --user --name Py36TF2.2 --display-name Py36TF2.2
    

    参考:
    [1] ubuntu安装cuda驱动实现nvidia-smi命令
    [2] 从零开始搭建深度学习服务器: 1080TI四卡并行
    [3] Linux服务器安装cuda,cudnn,显卡驱动和pytorch超详细流程
    [4.1]nvidia 官网
    [4.2]snapshot.debian.org
    [5] ubuntu18.04安装paddlepaddle开发环境
    [6] How To Install linux-headers-4.7.0-0.bpo.1-amd64 on Debian?
    [7] 如何解决Linux内核头文件和内核版本不同的问题?
    [8] 如何分分钟构建强大又好用的深度学习环境?
    [9] 搭建深度学习服务器环境

    相关文章

      网友评论

          本文标题:1、深度学习环境

          本文链接:https://www.haomeiwen.com/subject/wawdnhtx.html