CUDA

作者: crunch114 | 来源:发表于2021-08-06 08:21 被阅读0次

    CUDA

    CUDA VISIBLE DEVICE https://www.jianshu.com/p/22c0f8ec9a3e

    CUDA_VISIBLE_DEVICES=2,3 python my_script.py # Uses GPUs 2 and 3.
    代码里设置可见显卡

    if args.gpu == 'None':
        config.set_cuda(False)
    else:
        try:
            os.environ['CUDA_VISIBLE_DEVICES'] = str(args.gpu)
        except IndexError:
            config.set_cuda(False)
    

    如果要周期性的输出显卡的使用情况,可以用watch指令实现:
    watch -n 10 nvidia-smi

    升级CUDA版本

    看NVIDIA驱动版本
    sudo dpkg --list | grep nvidia-*nvidia-smi差不多,以前者为准,然后到 https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html不同版本cuda对应的NVIDIA驱动版本 (mamicode.com) 找对应的 CUDA 版本;
    检查linux版本 sudo dpkg --list | grep nvidia-*
    选择CUDA版本https://developer.nvidia.com/cuda-11.1.0-download-archive?target_os=Linux&target_arch=x86_64&target_distro=WSLUbuntu&target_version=20 或者 https://developer.nvidia.com/cuda-downloads?target_os=Linux

    CUDA版本检测https://zhuanlan.zhihu.com/p/48641682

    当CUDA9安装完成后,需要进行检测:

    1. cat /usr/local/cuda/version.txt #这种方法不太准,得到9.0.176

    2. nvcc --version #这种方法准。如果nvcc没有安装,则sudo apt install nvidia-cuda-toolkit。检查出来是7.5.17

    3)通过代码来查:

    cudaDriverGetVersion(&driver_version); #获取cuda版本。得到9.0

    cudaRuntimeGetVersion(&runtime_version); #获取cuda运行时版本。得到7.5

    4)检测显卡型号及NVIDIA驱动版本

    查看GPU型号 lspci | grep -i nvidia 得到M4000

    查看NVIDIA驱动版本 sudo dpkg --list | grep nvidia-* 得到384.130

    根据不同版本cuda对应的NVIDIA驱动版本(不同版本cuda对应的NVIDIA驱动版本 - LearnFromNow - 博客园),这个驱动应该对应cuda9.0

    5)进一步查是否环境变量的问题,参见 Ubuntu16.04下安装多版本cuda和cudnn - tunhuzhuang1836的博客 - CSDN博客

    在~/.bashrc中查看有无类似的语句,如有改成下面的样子,没有则增加:

    export PATH="$PATH:/usr/local/cuda/bin"

    export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64"

    export LIBRARY_PATH="$LIBRARY_PATH:/usr/local/cuda/lib64"

    然后继续nvcc --version还是得到7.5。

    6)检查nvcc

    which nvcc,发现是/usr/bin/nvcc,而实际上nvcc是应该在/usr/local/cuda/bin/nvcc。

    所以,sudo gedit /usr/bin/nvcc,把里面的内容"exec /usr/lib/nvidia-cuda-toolkit/bin/nvcc" 改成"exec /usr/local/cuda/bin/nvcc"

    然后继续nvcc --version这次得到9.0

    DGL安装

    https://www.dgl.ai/pages/start.html

    安装 base 包

    • 更新pip
      python -m pip install --upgrade pip
    • 安装 sklearn
      pip install -U scikit-learn
    • 1、使用Pip更新Pytorch和torchvision

    列举pip当前可以更新的所有安装包

    pip list --outdated --format=legacy

    更新pytorch和torchvision安装包

    pip install --upgrade pytorch torchvision

    • 2、使用conda更新Pytorch和torchvision

    建议将其添加soumith为您的Anaconda(或Miniconda)的源服务器

    conda config --add channels soumith

    更新pytorch和torchvision安装包

    conda update pytorch torchvision
    检查
    import torch
    print(torch.version)
    torch.cuda.is_available()返回 False
    torch.cuda.is_available()返回False,但nvidia-smi正常

    相关文章

      网友评论

          本文标题:CUDA

          本文链接:https://www.haomeiwen.com/subject/ehutnctx.html