美文网首页linux tools数据结构&算法&人工智能
ubuntu18.04配置深度学习环境tensorflow-gp

ubuntu18.04配置深度学习环境tensorflow-gp

作者: 零岁的我 | 来源:发表于2019-04-06 20:03 被阅读75次

    一、硬件配置

    在安装之前最好先检查自己的显卡是否支持GPU。
    内存:8G
    处理器:Intel® Core™ i5-7500 CPU @ 3.40GHz × 4
    显卡:GeForce GT 730/PCIe/SSE2
    操作系统类型:64位


    二、安装

    安装参照链接(https://zhuanlan.zhihu.com/p/50302396),非常感谢黄大佬的分享,参照以上链接安装基本没问题。
    本人一开始错以root用户安装,导致后面在普通用户环境下“他import tensorflow as tf”出现错误

    Traceback (most recent call last):
    File "<stdin>", line 1, in <module>
    ModuleNotFoundError: No module named 'tensorflow'
    以及错误
    ImportError: libcublas.so.10.0: cannot open shared object file: No such file or directory
    Failed to load the native TensorFlow runtime.

    后来是改到普通用户环境下重新执行安装步骤解决问题。

    具体安装步骤如下:

    1. 英伟达显卡驱动安装

    默认安装的显卡驱动不是英伟达的驱动,所以先把旧得驱动删除掉。

    sudo apt-get purge nvidia*

    禁止自带的nouveau nvidia驱动

    sudo vim /etc/modprobe.d/blacklist-nouveau.conf # 打开配置文件

    填写禁止配置的内容:

    blacklist nouveau
    options nouveau modeset=0

    更新配置文件,

    sudo update-initramfs -u

    添加Graphic Drivers PPA

    1. sudo add-apt-repository ppa:graphics-drivers/ppa
    1. sudo apt-get update

    查看合适的驱动版本:

    ubuntu-drivers devices

    image.png

    从图中可以看出可以选择的驱动版本,在这里我选择的版本是396。通过如下命令进行安装:安装完后需要进行重启。

    1 # 安装
    2 sudo apt-get install nvidia-driver-396
    3 # 重启
    4 sudo reboot

    安装完后,通过如下命令检测是否安装成功,如果成功会显示如下图所示。

    sudo nvidia-smi

    image.png

    sudo nvidia-settings

    image.png

    完成显卡驱动的安装。


    2. cuda 9.0 安装

    2.1 下载文件

    首先在官网上下载run 文件,如图所示,选择合适run文件。

    image.png
    同时下载4个Patch

    2.2 安装依赖库

    sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev

    2.3 降低gcc、g++的版本

    g++ --version # 查看版本

    安装指定版本

    1. sudo apt-get install gcc-5
    2. sudo apt-get install g++-5

    通过命令替换掉之前的版本:

    1. sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 50
    2. sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 50

    最后记得再次查看版本是否修改成功。

    2.4 安装cuda

    进入下载目录后,依次执行命令:
    注意:在安装过程中会提示是否需要安装显卡驱动,在这里要选择n,其他的选择y或者回车键进行安装:

    1. sudo sh cuda_9.0.176_384.81_linux.run
    2. sudo sh cuda_9.0.176.1_linux.run
    3. sudo sh cuda_9.0.176.2_linux.run
    4. sudo sh cuda_9.0.176.3_linux.run
    5. sudo sh cuda_9.0.176.4_linux.run

    在~/.bashrc 中设置环境变量:

    sudo vi ~/.bashrc

    在最后添加:

    export PATH=/usr/local/cuda-9.0/bin{PATH:+:{PATH}}
    export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64{LD_LIBRARY_PATH:+:{LD_LIBRARY_PATH}}

    运行

    source ~/.bashrc

    重启后,测试CUDA是否成功

    第一步,进入例子文件
    cd /usr/local/cuda-8.0/samples/1_Utilities/deviceQuery
    第二步,执行make命令
    sudo make
    第三步
    ./deviceQuery

    如果结果有GPU的信息,说明安装成功。


    3. 安装CUDNN

    下载链接: 官网

    需要登录,同意后才能下载。
    Download cuDNN v7.4.1(Nov 8, 2018), for CUDA 9.0 --cuDNNLibrary for Linux
    下载时候保存为:cudnn-9.0-linux-x64-v7.4.1.5.tgz
    进入下载目录,并执行以下命令:

    1. tar -zxvf cudnn-9.0-linux-x64-v7.4.1.5.tgz
    2. sudo cp cuda/include/cudnn.h /usr/local/cuda/include
    3. sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
    4. sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

    没有报错就是全部安装完成了。


    4. 安装anaconda

    1. 下载地址:https://www.anaconda.com/download/

    这里下载的是Python 3.7 64bit 的Anaconda3-5.3.0-Linux-x86_64.sh,首先进入下载目录i,直接安装即可。

    bash Anaconda3-5.3.0-Linux-x86_64.sh

    2. 更改pip和conda为国内的源

    A. 更改pip的源为阿里云:

    mkdir ~/.pip

    cat > ~/.pip/pip.conf << EOF
    [global]
    trusted-host=mirrors.aliyun.com
    index-url=https://mirrors.aliyun.com/pypi/simple/
    EOF

    B. 更改conda的源为清华大学:

    1. conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
    2. conda config --set show_channel_urls yes

    3. 在Anaconda中安装Python3.6的虚拟环境

    conda create --name tensorflow python=3.6 #创建tensorflow环境

    虚拟环境主要命令:

    1. source activate tensorflow #激活tensorflow环境
    2. source deactivate tensorflow #退出tensorflow环境
    3. conda remove --name tensorflow --all #删除tensorflow环境(全部删除)

    5. 安装Tensorflow GPU 1.9.0

    注意:这里如果直接用pip安装的话,在ubuntu上会直接默认安装到系统默认的python环境中,而不是虚拟环境tensorflow中
    激活虚拟环境tensorflow,用conda进行安装

    conda install tensorflow-gpu==1.9.0

    在使用conda命令时,如果遇到conda命令错误,可以在终端执行

    export PATH=~/anaconda3/bin:$PATH

    然后再使用conda命令进行安装

    参考链接:

    1. https://zhuanlan.zhihu.com/p/50302396
    2. https://blog.csdn.net/weixin_41863685/article/details/80303963

    喜欢就点个赞吧

    相关文章

      网友评论

        本文标题:ubuntu18.04配置深度学习环境tensorflow-gp

        本文链接:https://www.haomeiwen.com/subject/wwxdiqtx.html