美文网首页
关于原点对称的输入和中心对称的输出,网络会收敛地更好?

关于原点对称的输入和中心对称的输出,网络会收敛地更好?

作者: 听风1996 | 来源:发表于2019-12-10 22:28 被阅读0次

今天在讨论神经网络中的激活函数时,陆同学提出 Sigmoid 函数的输出不是以零为中心的(non-zero-centered),这会导致神经网络收敛较慢。关于这一点,过去我只是将其记下,却并未理解背后的原因。此篇谈谈背后的原因。

神经元


神经元

Sigmoid 与 tanh


此篇集中讨论激活函数输出是否以零为中心的问题,因而不对激活函数做过多的介绍,而只讨论 Sigmoid 与 tanh 两个激活函数。

Sigmoid 函数



tanh 函数



一些性质

Sigmoid 和 tanh 两个函数非常相似,具有不少相同的性质。简单罗列如下

优点:平滑
优点:易于求导
缺点:幂运算相对耗时
缺点:导数值小于 1,反向传播易导致梯度消失(Gradient Vanishing)

对于 Sigmoid 函数来说,它的值域是 (0,1),因此又有如下特点

优点:可以作为概率,辅助模型解释
缺点:输出值不以零为中心,可能导致模型收敛速度慢

此篇重点讲 Sigmoid 函数输出值不以零为中心的这一缺点。

收敛速度

这里首先需要给收敛速度做一个诠释。模型的最优解即是模型参数的最优解。通过逐轮迭代,模型参数会被更新到接近其最优解。这一过程中,迭代轮次多,则我们说模型收敛速度慢;反之,迭代轮次少,则我们说模型收敛速度快。

参数更新

以零为中心的影响



如图,模型参数走绿色箭头能够最快收敛,但由于输入值的符号总是为正,所以模型参数可能走类似红色折线的箭头。如此一来,使用 Sigmoid 函数作为激活函数的神经网络,收敛速度就会慢上不少了。

相关文章

  • 关于原点对称的输入和中心对称的输出,网络会收敛地更好?

    **本文作者: **Liam Huang 本文链接: https://liam.page/2018/04/17/z...

  • 计算机中的对称

    我们对于图形会有中心对称的图形,比如函数f(x)=sinx的图形,是关于原点的中心对称的图形,还有一种就是成轴对称...

  • 2020-10-04

    今天上午三四节学习关于原点对称的点的坐标 雨过仲秋天,气清伊水岸。 杨柳轻拂面,阳光普照咱! 直角坐标系,中心对称...

  • 1. 函数的奇偶性

    奇函数: 定义域关于原点对称 图像关于(0, 0)对称 若存在,则 偶函数: 定义域关于原点对称 图像关于 对称...

  • 行测—判断—图推—对称

    对称 1 区分轴对称图形、中心对称图形、轴+中心对称图形 对称轴特征图形: 等腰三角形、箭头、五角星、等腰梯形。 ...

  • 第8节:行测之图形推理

    1、轴对称 2、中心对称图形 3、对称判定方法 平行四边形不是轴对称图形,但是是中心对称;最后一张图既不是轴对称也...

  • 【图形推理】

    注意中心对称和上下翻转的区别哦中心对称是把卷子倒过来,但是上下翻转不是 短线数同一位置出现次数(图形、颜色)平行线...

  • 小记

    今天的课堂内容是中心对称图形,基本概念讲解完,PPT上展示几个扑克牌让学生判断哪些是中心对称图形,哪些不是。这个内...

  • 输入是为了更好地输出

    坚持日更三个月左右,除去日常生活的观察思考,渐渐发现能写的题材越来越少。 一个人的见识有限,还是得输入,都说“读万...

  • 多读书 多写字

    有输入才能更好的输出,而输出可以帮助自己更好地消化输入的知识。所以,人应该多阅读,书可以引发人思考,有了思考,脑袋...

网友评论

      本文标题:关于原点对称的输入和中心对称的输出,网络会收敛地更好?

      本文链接:https://www.haomeiwen.com/subject/jujngctx.html