优化的问题:梯度消失、局部最优
梯度消失、梯度爆炸
image.png局部最优:
image.png
image.png
梯度下降
image.png
image.png
image.png
梯度下降的优化影响
image.png
image.png
image.png
大小选择
image.png
指数加权平均(梯度下降算法本身的优化)
image.pngimage.png
image.png
image.png
image.png
image.png
权重越大,曲线越平滑,权重越小,曲线越曲折
image.png
动量梯度下降法
image.png这样的梯度下降有什么变化:
image.png
image.png
RMSProp算法
image.pngimage.png
Adam算法
image.pngimage.png
image.png
image.png
image.png
tensorflow Adam算法API
image.png学习率衰减
image.png标准化输入
image.pngimage.png
image.png
image.png
image.png
代码练习
动量梯度下降
image.png公式中的s在代码中定义成了v
image.png
更新Adam算法网络的参数
image.pngimage.png
image.png
image.png
image.png
网友评论