TensorFlow中的Nan值的陷阱

作者: 马小李23 | 来源:发表于2017-08-25 22:05 被阅读854次

TensorFlow中的Nan值的陷阱
python中的nan值以及处理
JS中对数组进行去重的几种方法
array操作
如何删除列表里的nan值？
JavaScript运算符中的特性
JavaScript数组去重
在JavaScript中，NaN == NaN 返回false的
原生javascript的知识点(一)
Tensorflow Gradients is NAN

之前在TensorFlow中实现不同的神经网络，作为新手，发现经常会出现计算的loss中，出现Nan值的情况，总的来说，TensorFlow中出现Nan值的情况有两种，一种是在loss中计算后得到了Nan值，另一种是在更新网络权重等等数据的时候出现了Nan值，本文接下来，首先解决计算loss中得到Nan值的问题，随后介绍更新网络时，出现Nan值的情况。

Loss计算中出现Nan值

在搜索以后，找到StackOverflow上找到大致的一个解决办法（原文地址：这里），大致的解决办法就是，在出现Nan值的loss中一般是使用的TensorFlow的log函数，然后计算得到的Nan，一般是输入的值中出现了负数值或者0值，在TensorFlow的官网上的教程中，使用其调试器调试Nan值的出现，也是查到了计算log的传参为0；而解决的办法也很简单，假设传参给log的参数为y，那么在调用log前，进行一次数值剪切，修改调用如下：
loss = tf.log(tf.clip_by_value(y,1e-8,1.0))
这样，y的最小值为0的情况就被替换成了一个极小值，1e-8，这样就不会出现Nan值了，StackOverflow上也给出了相同的解决方案。于是，我就采用了上述的解决方案对于log的参数进行数值限制，但是我更加复杂化了这个限制。
tf.clip_by_value这个函数，是将第一个参数，限制在第二、三个参数指定的范围之内，使用这个函数的原意是要避免0值，并没有限制最大值，因而我将限制的调用修改如下：
loss = tf.log(tf.clip_by_value(y,1e-8,tf.reduce_max(y)))
这样就确保了对于y值的剪切，不会影响到其数值的上限。但是在实际的神经网络中使用的时候，我发现这样修改后，虽然loss的数值一直在变化，可是优化后的结果几乎是保持不变的，这就存在问题了。
经过检查，其实并不能这么简单的为了持续训练，而修改计算损失函数时的输入值。这样修改后，loss的数值很可能（存在0的话确定就是）假的数值，会对优化器优化的过程造成一定的影响，导致优化器并不能正常的工作。
要解决这个假的loss的方法很简单，就是人为的改造神经网络，来控制输出的结果，不会存在0。这就需要设计好最后一层输出层的激活函数，每个激活函数都是存在值域的，详情请见这篇博客，比如要给一个在(0,1)之间的输出（不包含0），那么显然sigmoid是最好的选择。不过需要注意的是，在TensorFlow中，tf.nn.sigmoid函数，在输出的参数非常大，或者非常小的情况下，会给出边界值1或者0的输出，这就意味着，改造神经网络的过程，并不只是最后一层输出层的激活函数，你必须确保自己大致知道每一层的输出的一个范围，这样才能彻底的解决Nan值的出现。
举例说明就是TensorFlow的官网给的教程，其输出层使用的是softmax激活函数，其数值在[0,1]，这在设计的时候，基本就确定了会出现Nan值的情况，只是发生的时间罢了。

更新网络时出现Nan值

更新网络中出现Nan值很难发现，但是一般调试程序的时候，会用summary去观测权重等网络中的值的更新，因而，此时出现Nan值的话，会报错类似如下：
InvalidArgumentError (see above for traceback): Nan in summary histogram for: weight_1
这样的情况，一般是由于优化器的学习率设置不当导致的，而且一般是学习率设置过高导致的，因而此时可以尝试使用更小的学习率进行训练来解决这样的问题。

TensorFlow中的Nan值的陷阱
之前在TensorFlow中实现不同的神经网络，作为新手，发现经常会出现计算的loss中，出现Nan值的情况，总的...
python中的nan值以及处理
1，什么是nan值其实nan值指的是NaN值，指的是在计算机中无法表示的数字 2，python中如何处理一般碰...
JS中对数组进行去重的几种方法
JavaScript中NaN是什么？对NaN的认识 NaN 非数字（not a number）属性是代表非数字值的...
array操作
将数组中的nan值赋值
如何删除列表里的nan值？
np.nan有一个特性：np.nan == np.nan的值为False所以删除列表里的nan值：所以查看是否有...
JavaScript运算符中的特性
算数运算符的特性 1.任何值和NaN运算, 得到的结果都是NaN 1+NaN--->NaN 2.任何值和字符串进行...
JavaScript数组去重
注意一点：在JavaScript中，有一个值和它自身不相等。NaN === NaN // falsenull ==...
在JavaScript中，NaN == NaN 返回false的
NaN意思为Not a Number，js中number数据类型中除了整型和浮点型，还有一个特殊的值 NaN。它表...
原生javascript的知识点(一)
NaN: NaN这个特殊的Number与所有其他值都不相等，包括它自己NaN === NaN; // false唯...
Tensorflow Gradients is NAN
(from stack overflow) https://stackoverflow.com/questions...

TensorFlow中的Nan值的陷阱

Loss计算中出现Nan值

更新网络时出现Nan值

相关文章

TensorFlow中的Nan值的陷阱

python中的nan值以及处理

JS中对数组进行去重的几种方法

array操作

如何删除列表里的nan值？

JavaScript运算符中的特性

JavaScript数组去重

在JavaScript中，NaN == NaN 返回false的

原生javascript的知识点(一)

Tensorflow Gradients is NAN

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

TensorFlow

TensorFlow技术帖

人工智能/模式识别/机器学习精华专题

机器学习与数据挖掘

我爱编程