关于Linux+GPU服务器下GPU显存不足问题

关于Linux+GPU服务器下GPU显存不足问题

作者: 米兰的小码农 | 来源:发表于2019-05-07 22:08 被阅读6次

关于Linux+GPU服务器下GPU显存不足问题
深度学习跑视觉相关模型，运行一段时间直接卡死，问题排查
Keras学习笔记（4）Resource exhausted:
GPU 初理解
人脸技术合集
GPU资源耗尽
[解决]GPU显存未释放问题
持续显示显卡信息显存满了杀死程序
caffe问题
深度学习训练中的OOM

1. 问题描述

在基于Linux操作系统环境下的GPU服务器上跑深度学习代码时，我们常常会因为如不正常退出等问题导致资源没被正常回收而出现GPU显存不足的情况，此时再次运行学习代码就会出现如下图所示报错情况。从图片上可以看出我10.91GiB的显存仅剩下362.38MiB，报错提示原因也是ResourceExhaustedError(资源耗尽错误)。

问题描述

Traceback

2. 解决方法

2.1 传统方法

传统方法当然是重启呀，这是在不知道解决办法时的万能钥匙，手动滑稽。

2.2 杀死进程法

使用fuser命令显示所有占用nvidia设备的进程processID。（说明：fuser命令能展列出当前磁盘上的某个文件、挂载点、以及网络端口的使用情况，并显示使用其资源的进程processID，默认情况下每个文件名后面跟一个字母表示访问类型）

sudo fuser /dev/nvidia*

操作过程如下：

使用fuser命令
使用kill命令将占用Nvidia设备的进程杀掉，并再次使用fuser命令确认。（说明：使用kill命令时默认的命令参数为-15，而kill -15代表的信号为SIGTERM，这是告诉进程进行终止操作，这并不能保证一定杀干净；而kill -9代表的信号是SIGKILL，表示进程被杀死，不能被忽略）

kill -9 PID
sudo fuser /dev/nvidia*

其中我的PID为上图的22448，操作过程如下图所示：
使用kill命令

3.备注

到此问题就解决了，继续学习。
问题是本人在Ubuntu 16.04系统下使用tensorflow框架在Nvidia GTX 1080Ti上进行机器学习时遇到的。因为经常会遇到，所以做了问题总结，希望对出现同样问题的你有所帮助。

相关文章

关于Linux+GPU服务器下GPU显存不足问题
1. 问题描述在基于Linux操作系统环境下的GPU服务器上跑深度学习代码时，我们常常会因为如不正常退出等问题导...
深度学习跑视觉相关模型，运行一段时间直接卡死，问题排查
首先考虑gpu问题，如果是显存等不足，应该是程序直接终止。使用watch -n 1 nvidia-smi监视gpu...
Keras学习笔记（4）Resource exhausted:
分配的显存超过GPU可用的最大显存，显存不足（OOM, Out of Memory) 分析：这样的话可能有两个原因...
GPU 初理解
GPU = 显存 + 计算单元 1、显存（Global Memory）：显存是在GPU板卡上的DRAM，类似于CP...
人脸技术合集
笔者服务器环境 gpu : nvidia 1080ti , 显存11G cpu : Intel(R) Xeon...
GPU资源耗尽
在使用kersa的时候出现如下关于gpu显存不够的的错误： [ResourceExhaustedError :OO...
[解决]GPU显存未释放问题
我们在使用tensorflow+pycharm 或者PyTorch写程序的时候,有时候会在控制台终止掉正在运行的程...
持续显示显卡信息显存满了杀死程序
查看gpu使用情况，发现gpu显存（memory-usage）满了，但是使用率（gpu-util）是0。上面的进程...
caffe问题
遇到的问题：一、GPU显存不够按照楼主的设置跑的话，很有可能会出现如下错误： Check failed: er...
深度学习训练中的OOM
1、内存、显存的概念内存是相对于CPU来说的，而显存是相对于GPU来说的。 2、查看内存和显存使用情况内存查看...

网友评论

本文标题：关于Linux+GPU服务器下GPU显存不足问题

本文链接：https://www.haomeiwen.com/subject/efxuoqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

大数据，机器学习，人工智能

人工智能/模式识别/机器学习精华专题

热点阅读

大数据，机器学习，人工智能

机器学习

人工智能/模式识别/机器学习精华专题

关于我们|服务条款|联系我们|关于Linux+GPU服务器下GPU显存不足问题|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！