美文网首页
Ubuntu18.04配置GPU训练Tenforflow

Ubuntu18.04配置GPU训练Tenforflow

作者: Boahui | 来源:发表于2020-03-09 09:06 被阅读0次

    系统配置
    1、Navidia 2070S
    2、Ubuntu18.04
    3、安装Anaconda3
    4、安装Pycharm
    打开项目 FOTS_TF 配置Project Interpreter 到Anaconda3

    2020-03-09 08-33-38屏幕截图.png
    5、安装项目需要的库
    pip install tensorflow==1.14.0
    pip install tensorflow-gpu==1.14.0
    tensorflow和tensorflow-gpu版本要一致
    6、安装CUDA 和 cuDNN
    查看CUDA 版本 cat /usr/local/cuda/version.txt
    查看cuDNN版本 cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
    2020-03-09 08-42-36屏幕截图.png
    注意 CUDA 和 cuDNN和Tensoflow是有版本之间的对应关系的
    可参考这个文章https://www.skymei.cn/archives/171.html
    有的CUDA 在安装时,在接受了用户协议的下一步 会询问是否需要安装GPU 驱动 ,如果是在Ubuntu启动的是图形界面可能回提示驱动安装不成功,nvadia的某些模块已经被载入内核,这个时候可以切换到命令行界面安装CUDA。
    安装完CUDA后可以看到/usr/local/cuda一个软连接到cuda-10.0的文件夹
    7、在查看是否支持GPU
    import tensorflow as tf
    sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
    如果发现
    Could not dlopen library 'libcudart.so.10.0'; dlerror: libcudart.so.10.0: cannot open shared object file: No such file or directory
    Could not dlopen library 'libcublas.so.10.0'; dlerror: libcublas.so.10.0: cannot open shared object file: No such file or directory
    Could not dlopen library 'libcufft.so.10.0'; dlerror: libcufft.so.10.0: cannot open shared object file: No such file or directory
    Could not dlopen library 'libcufft.so.10.0'; dlerror: libcufft.so.10.0: cannot open shared object file: No such file or directory
    Could not dlopen library 'libcusolver.so.10.0'; dlerror: libcusolver.so.10.0: cannot open shared object file: No such file or directory
    Could not dlopen library 'libcusparse.so.10.0'; dlerror: libcusparse.so.10.0: cannot open shared object file: No such file or directory
    参考
    https://blog.csdn.net/qq_36368388/article/details/97927154
    8、运行项目
    Unknown Error : Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.的解决办法
    参考 https://blog.csdn.net/qq_42054834/article/details/93638255

    首先,判断自己的cuDNN版本是否安装正确

    一般可以正常使用tensorflow,cuDNN装的应该就没什么问题

    尝试在程序开头添加以下代码

    from tensorflow.compat.v1 import ConfigProto
    from tensorflow.compat.v1 import InteractiveSession
    config = ConfigProto()
    config.gpu_options.allow_growth = True
    session = InteractiveSession(config=config)
    

    相关文章

      网友评论

          本文标题:Ubuntu18.04配置GPU训练Tenforflow

          本文链接:https://www.haomeiwen.com/subject/gxnydhtx.html