简单解释Momentum,RMSprop,Adam优化算法

作者: zenRRan | 来源:发表于2018-01-31 17:48 被阅读756次

简单解释Momentum,RMSprop,Adam优化算法
Momentum，RMSprop，Adam算法
2015-8-1 优化
优化方法总结
梯度下降优化方法总结
多层神经网络，从零开始——（九）、优化函数
从Momentum、RMSprop到Adam
吴恩达深度学习笔记(44)-RMSprop9
Adam优化方法
2019-11-01第二课二周优化算法

我们初学的算法一般都是从SGD入门的，参数更新是：

它的梯度路线为：

但是可以看出它的上下波动很大，收敛的速度很慢。因此根据这些原因，有人提出了Momentum优化算法，这个是基于SGD的，简单理解，就是为了防止波动，取前几次波动的平均值当做这次的W。这个就用到理论的计算梯度的指数加权平均数，引进超参数beta(一般取0.9)：

beta和1-beta分别代表之前的dW权重和现在的权重。

效果图如下(红色)：

下面继续另一种加速下降的一个算法RMSprop，全称root mean square prop。也用到权重超参数beta（一般取0.999），和Momentum相似：

其中dW的平方是(dW)^2，db的平方是(db)^2。如果严谨些，防止分母为0，在分数下加上个特别小的一个值epsilon，通常取10^-8。

效果图如下(绿色)：

研究者们其实提出了很多的优化算法，可以解决一些问题，但是很难扩展到多种神经网络。而Momentum，RMSprop是很长时间来最经得住考研的优化算法，适合用于不同的深度学习结构。所以有人就有想法，何不将这俩的方法结合到一起呢？然后，pia ji一下，Adam问世了。全程Adaptive Moment Estimation。算法中通常beta_1=0.9,beta_2=0.999。

算法为(很明显看出是两者的结合，其中多了一步V和S的调节，t为迭代次数，除以1-beta^t表示越近的重要，越远的就可以忽视)：

因为Adam结合上述两种优化算法的优点于一身，所以现在经常用的是Adam优化算法。

感谢Andrew Ng的视频！

欢迎关注深度学习自然语言处理公众号，我会频繁更新自己在该路上的理论与实践。

简单解释Momentum,RMSprop,Adam优化算法
我们初学的算法一般都是从SGD入门的，参数更新是：它的梯度路线为：但是可以看出它的上下波动很大，收敛的速度很慢...
Momentum，RMSprop，Adam算法
1 Mini-batch梯度下降 Mini-batch解决了批量梯度下降单次迭代样本多，速度慢的问题，也解决了随机...
2015-8-1 优化
【Chainer下各种优化算法(SGD/AdaGrad/RMSprop/ADAM/...)比较】《Chainer ...
优化方法总结
SGD，Momentum，AdaGrad，RMSProp，Adam 1. SGD Batch Gradient D...
梯度下降优化方法总结
1. 主要内容 SGD，Momentum，AdaGrad，RMSProp，Adam 1.1. SGD 1.1.1 ...
多层神经网络，从零开始——（九）、优化函数
常用的优化算法有：随机梯度下降、带动量的随机梯度下降、AdaGrad算法、RMSProp算法、Adam算法，其中A...
从Momentum、RMSprop到Adam
Momentum、RMSprop是两种对梯度下降法的改进方法，他们能够使梯度下降运行得更快，而Adam算法又是Mo...
吴恩达深度学习笔记(44)-RMSprop9
RMSprop 你们知道了动量（Momentum）可以加快梯度下降，还有一个叫做RMSprop的算法，全称是roo...
Adam优化方法
整理动量梯度下降算法的时候，这一类大概有3种：动量梯度下降 RMSprop Adam 优化算法这里主要记录一下...
2019-11-01第二课二周优化算法
指数加权平均：动量梯度下降法： RMSprop：和动量梯度下降法相似 adam优化算法：将动量梯度下降法和RMS...

简单解释Momentum,RMSprop,Adam优化算法

相关文章

简单解释Momentum,RMSprop,Adam优化算法

Momentum，RMSprop，Adam算法

2015-8-1 优化

优化方法总结

梯度下降优化方法总结

多层神经网络，从零开始——（九）、优化函数

从Momentum、RMSprop到Adam

吴恩达深度学习笔记(44)-RMSprop9

Adam优化方法

2019-11-01第二课二周优化算法

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

深度学习

DeepLearning

大数据，机器学习，人工智能

深度学习·神经网络·计算机视觉

Python语言与信息数据获取和机器学习