美文网首页
梯度消失、梯度爆炸 2020-02-18

梯度消失、梯度爆炸 2020-02-18

作者: allen成 | 来源:发表于2020-02-18 20:06 被阅读0次

    梯度消失、梯度爆炸以及Kaggle房价预测

    • 梯度消失和梯度爆炸
    • 考虑到环境因素的其他问题
    • Kaggle房价预测

    梯度消失和梯度爆炸

    深度模型有关数值稳定性的典型问题是消失(vanishing)和爆炸(explosion)。

    当神经网络的层数较多时,模型的数值稳定性容易变差。

    假设一个层数为 L 的多层感知机的第 l 层 H(l) 的权重参数为 W(l) ,输出层 H(L) 的权重参数为 W(L) 。为了便于讨论,不考虑偏差参数,且设所有隐藏层的激活函数为恒等映射(identity mapping) ϕ(x)=x 。给定输入 X ,多层感知机的第 l 层的输出 H(l)=XW(1)W(2)…W(l) 。此时,如果层数 l 较大, H(l) 的计算可能会出现衰减或爆炸。举个例子,假设输入和所有层的权重参数都是标量,如权重参数为0.2和5,多层感知机的第30层输出为输入 X 分别与 0.230≈1×10−21 (消失)和 530≈9×1020 (爆炸)的乘积。当层数较多时,梯度的计算也容易出现消失或爆炸。

    相关文章

      网友评论

          本文标题:梯度消失、梯度爆炸 2020-02-18

          本文链接:https://www.haomeiwen.com/subject/kdsnfhtx.html