深度学习的Nan问题

深度学习的Nan问题

作者: HelloShane | 来源:发表于2018-09-24 12:22 被阅读0次

深度学习的Nan问题
训练深度学习模型时出现nan的原因
Lua——NAN问题
== 和 === 如何使用？
“深度学习”之感
深度学习问题
《深度学习的艺术》笔记
deep learning update error loss
【深度学习-1】安装TensorFlow
pytorch loss 出现 nan

相信很多人都遇到过训练一个deep model的过程中，loss突然变成了NaN。在这里对这个问题做一个总结。

一般来说，出现NaN有以下几种情况：

如果在迭代的100轮以内，出现NaN，一般情况下的原因是因为你的学习率过高，需要降低学习率。可以不断降低学习率直至不出现NaN为止，一般来说低于现有学习率1-10倍即可。
如果当前的网络是类似于RNN的循环神经网络的话，出现NaN可能是因为梯度爆炸的原因，一个有效的方式是增加“gradient clipping”（梯度截断来解决）
可能用0作为了除数;
可能0或者负数作为自然对数
需要计算loss的数组越界（尤其是自己，自定义了一个新的网络，可能出现这种情况）
在某些涉及指数计算，可能最后算得值为INF（无穷）（比如不做其他处理的softmax中分子分母需要计算exp（x），值过大，最后可能为INF/INF，得到NaN，此时你要确认你使用的softmax中在计算exp（x）做了相关处理（比如减去最大值等等））
一般来说下溢出在python里面会导致0，Nan是指的是上溢

相关文章

深度学习的Nan问题
相信很多人都遇到过训练一个deep model的过程中，loss突然变成了NaN。在这里对这个问题做一个总结。一...
训练深度学习模型时出现nan的原因
在训练深度学习的网络时候，迭代一定次数，会出现loss是nan，然后acc很快降低到了0.1，训练也就无法继续了。...
Lua——NAN问题
NAN（Not A Number），lua中是0/0运算会产生。不同语言的定义不同。今天unity3d项目遇到一...
== 和 === 如何使用？
为什么有这样问题？== 会造成子类型的转换，=== 区分不了 NaN === NaN (返回false)，+0 =...
“深度学习”之感
第一次听到“深度学习”这个问题，我全蒙了，想着学习还要深度学习，什么是深度学习，怎么深度学习呢？听了贾老师的课...
深度学习问题
1 输入输出数据的分布不能太夸张，否则会影响神经网络的权重分布，进而导致模型训练过程的参数梯度消失，预测出来的结果为空
《深度学习的艺术》笔记
书名：深度学习的艺术-采铜问题：如何成为高段位的学习者动机：怎样达到深度学习本来深度学习这本书要用30分钟看...
deep learning update error loss
为什么用tensorflow训练网络，出现了loss=nan最常见的原因是学习率太高。对于分类问题，学习率太高会导...
【深度学习-1】安装TensorFlow
Rapp从今天起推出【深度学习】系列，主要记录自己在学习深度学习技术的过程中遇到的问题和心得。在深度学习领域，Ra...
pytorch loss 出现 nan
排查问题：调整学习率为0，loss还为NAN---->与学习率无关模型内关于除、log等可能出现异常的操作，加...

网友评论

本文标题：深度学习的Nan问题

本文链接：https://www.haomeiwen.com/subject/mmicoftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|深度学习的Nan问题|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！