美文网首页
残差网络(ResNet)解决梯度消失问题

残差网络(ResNet)解决梯度消失问题

作者: 笑傲NLP江湖 | 来源:发表于2021-11-18 17:21 被阅读0次

一、 引言
残差网络(ResNet)是何凯明在2015年提出的。可以说该网络模型的提出是CNN图像史上的里程碑事件。它解决了当时传统CNN网络发展所遇到的瓶颈——网络深度问题。当时,人们普遍认为网络的深度越深,网络的效果会越好。但是随着人们的研究发现,更深的网络居然会使得网络效果变差,这也就是网络的退化,而梯度消失则是导致网络退化的一个重要因素。何凯明提出的ResNet正是解决了问题,将14年VGG的19层网络提高到了ResNet惊人的152层,并且获得了更好的网络效果。

二、梯度消失:
当一个深层网络的激活函数全部采用sigmod函数时,会导致梯度消失的出现。可以从数学角度计算一下为什么会出现梯度消失(非严格证明)。
假设一个最简单的网络,如图。


其中,X_{i}X_{i+1}为网络中某一较浅层的输入输出( X_{i+1} 同时为下一层的输入), X_{i}为某一深层的输出,F()为层内的映射,记Sigmod函数为S()。由此可得:

更新梯度时:


sigmod函数的导数图像为:


由图像可知, S_{n}^{\prime} 的取值范围是[0,0.25],也就是当越浅层(式中 S_{n}^{\prime}项数越多),梯度值越接近0,也就造成了梯度消失,浅层参数更新困难。

三、残差网络如何解决梯度消失:
残差网络是由许多具有相似结构的部分组成的,每一部分通常被称为“残差块”,如下图,其中F(x)表示残差函数。残差网络的精妙之处在于它把对于完整的输出的学习问题归结于对于残差的学习(Residual Learning)问题。何凯明有这样想法的灵感来源于如果只把浅层的输出做恒等映射(即F(X)=0)输入到深层,这样网络加深也并不会出现网络退化。所以,他在网络中加入了“短路”机制,并且这样不但解决了梯度消失问题,同时也提高了计算效率,可以从数学角度分析一下为什么会有这样的效果(非严格证明)。


与2中类似,设X_{i}X_{i+1}为网络中某一较浅层残差块的输入输出 (X_{i+1}同时为下一残差块的输入),X_{i}为某一深层残差块的输出(可以把一个残差块理解为网络的一层),残差函数记为F(),记relu函数为r()(假设每一残差块的输入输出都为正),由此可得:

.... .... ....


更新梯度时:


从结果可以看出,因为有“1”的存在,高层的梯度可以直接传递到低层,有效防止了梯度消失的情况。并且对比2中推出的公式可以发现,残差网络在更新梯度时把一些乘法转变为了加法,同时也提高了计算效率。

相关文章

  • 残差网络(ResNet)解决梯度消失问题

    一、 引言残差网络(ResNet)是何凯明在2015年提出的。可以说该网络模型的提出是CNN图像史上的里程碑事件。...

  • 十分钟一起学会ResNet残差网络

    目录 深层次网络训练瓶颈:梯度消失,网络退化 ResNet简介 ResNet解决深度网络瓶颈的魔力 ResNet使...

  • ResNet网络解决的一些事

    ResNet主要解决了网络退化以及梯度消失/爆炸这两个主要问题,使得网络可以通过加深提高准确率~ 深度卷积网络自然...

  • 卷积神经网络-第二周-吴恩达 Deep Learning Spe

    残差网络(Residual Networks,ResNets) 随着网络深度的增加而容易出现的 梯度消失和梯度爆炸...

  • CNN网络的宽度和深度

    CNN网络的宽度和深度都很重要 ResNet、DenseNet解决的是如何让网络更深且避免梯度消失、网络退化 各类...

  • 深度残差网络论文(ResNet)

    出现的问题: 提出的解决方法: 针对上述问题,作者提出了深度残差网络(ResNet)。即对应输入x,经过若干层卷积...

  • CNN经典模型——ResNet

    ResNet(Residual Neural Network)简介 残差网络(ResNet) 是2015年由何恺明...

  • Resnet原理

    0 前言 Resnet一般用于图像分类问题,它是一种残差网络,其实是从VGG发展而来,可以解决传统网络深度加深而出...

  • 残差网络 resnet

    1) 优点 残差网络更容易优化,并且能够通过增加相当的深度来提高准确率。(网络越深,提取到的特征越多,表达能力越强...

  • ResNet 残差网络

    一、引言 由于深度学习的广泛应用,出现了一个新问题:训练一个更好的网络是否和堆叠更多的层一样简单呢?解决这一问题的...

网友评论

      本文标题:残差网络(ResNet)解决梯度消失问题

      本文链接:https://www.haomeiwen.com/subject/ungdtrtx.html