美文网首页机器学习
无root权限部署GPU环境:RHEL + GPU Tesla

无root权限部署GPU环境:RHEL + GPU Tesla

作者: 大海龟啦啦啦 | 来源:发表于2020-05-28 10:43 被阅读0次

参考链接:(https://blog.csdn.net/qq_29762941/article/details/80630585

安装tensorflow前需要安装cuda,我的安装顺序是安装cuda,cudnn,tensorflow。

安装包准备

1、cuda9.0 runfile安装包(https://developer.nvidia.com/cuda-toolkit-archive),在选择linux及对应的系统之后,选择 runfile(local)下载
2、cuda9.0的4个补丁包(https://developer.nvidia.com/cuda-toolkit-archive
3、cuda9.0对应的cudnn压缩包下载(https://developer.nvidia.com/rdp/cudnn-download

安装步骤

1、安装cuda9.0

bash cuda_9.0.176_384.81_linux.run
运行之后出现以下图片之后按空格一直到底下显示accept/decline/quit:

1、输入accept
2、不安装NVIDIA Accelerated Graphics Driver
3、安装CUDA 9.0 Toolkit
4、选择自己的安装目录/home/chenhx/cuda_9.0
5、不建立link
6、不安装CUDA 9.0 Samples
7、将四个补丁包都按照这个runfile的形式跑出来,然后路径都和上面一样填

2、修改环境变量

在~/.bashrc文件末尾添加

export PATH=$HOME/cuda_9.0/bin:$PATH 
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$HOME/cuda_9.0/lib64/

修改完之后要source ~/.bashrc使环境变量立即生效
安装完之后用nvcc -V查看cuda-toolkit安装是否成功,用which nvcc查看nvcc的安装位置是否是自己的目录

3、安装cudnn

将从官网下载到的压缩包解压到cuda文件夹,这一步应该是你自己的安装包名

tar -zxvf cudnn-9.0-linux-x64-v7.1.tgz

把cudnn里面的东西copy到cuda_9.0中

cp cuda/include/cudnn.h ~/cuda_9.0/include/
cp cuda/lib64/libcudnn* ~/cuda_9.0/lib64/
chmod a+r ~/cuda_9.0/include/cudnn.h ~/cuda_9.0/lib64/libcudnn*

查看cudnn安装情况

cat ~/cuda_9.0/include/cudnn.h | grep CUDNN_MAJOR -A5

显示如下即为安装成功



我对应的cudnn版本为7.13

4、安装机器学习框架tensorflow

注: 这里也可以安装pyTorch
用pip安装tensorflow tensorflow-gpu matplotlib pasdas keras

pip install tensorflow tensorflow-gpu matplotlib pasdas keras

5、检查gpu和cpu版本的tf

在python终端中逐行输入以下代码

import tensorflow as tf
hi = tf.constant('Hi , welcome to TensorFlow ! ')
sess = tf.Session()
print(sess.run(hi).decode())

最后出现下图所示


如果你出现这个结果的话,恭喜你,已经完成了GPU环境部署!!!

来自李团长的夸奖.jpg

相关文章

网友评论

    本文标题:无root权限部署GPU环境:RHEL + GPU Tesla

    本文链接:https://www.haomeiwen.com/subject/kckoahtx.html