一开始花了几天在linux上重新编译tensorflow,遇到各种各样的问题,而且耗费时间非常长,还是在最后一步失败了.
这个故事告诉我们,最好先别直接编译tensorflow。
由于我现在用的是CUDA9.2,而目前tf 的official pip package最新的还是cuda 9.0,所以后来我决定把cuda版本下降至9.0,然后再配置,最后终于成功了.
1,卸载cuda9.2
sudo apt-get remove cuda
sudo apt-get autoclean
sudo apt autoremove cuda(选)
sudo apt-get remove nvidia*(选)
2,接下来按照下面的网址配置就可以完成
http://www.python36.com/install-tensorflow-using-official-pip-pacakage/
(注意最好配置编译好的版本,否则会很痛苦)
3,问题
0,CUDA文件,和cudnn下载极端缓慢
我们竟然可以直接复制链接,到迅雷下载上下,又块又稳定。
1,在step6 中安装步骤会和cuda官网上的安装步骤冲突,这里结合使用下面命令(deb local):
sudo dpkg -i cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb
sudo apt-key add /var/cuda-repo-/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda-9-0(这里不能使用sudo apt-get install cuda,否则会安装最新版本)
但是这里还会出现mismatching的问题,导致无法安装.最后发现的问题是我之前配置了很多国内的镜像源,我把这些源删除之后重新安装就可以通过了.
sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak
sudo gedit /etc/apt/sources.list #修改源
sudo apt-get update
sudo apt-get upgrade
在step 9 中,并没用cuDNN 7.1.2的相关下载,这里降级为cuDNN 7.0.5 版本.
网友评论