深度学习 - 草稿 - 草稿

作者: 慕拾 | 来源:发表于2018-02-25 14:03 被阅读0次

深度学习 - 草稿 - 草稿 - 草稿
深度学习 - 草稿 - 草稿
草稿
深度学习 - 草稿
流程：述简单的后台编辑发布流程
周末复盘
十一四天接触工作坊
2015年申论写作（省级）| Notes
怎么画原创的漫画人物？不会画原创怎么办？
5. 资料分析 | 行测 | 统计学分析

mini-batch size = m则为批梯度下降进行梯度下降时处理全部的训练样本，如果训练样本的数据量很大，则，进行一次梯度下降要耗费很长时间

size=1 即为随机梯度下降随机梯度下降每次只处理训练样本中的一个训练数据往往只是朝着局部最优的方向下降，噪声比较大，随机梯度下降不会收敛到全局的最小值只会朝着最小值方向不断下降，失去了所有由向量化而带来的优势

使用指数加权平均办法类似于递归公示形式，通过赋予权重系数实现求得前50天平均值的效果比真正把前50天数据load到内存加以平均的算法好在可以节约存储数据的内存。

普通的梯度下降不能使用太大的学习率，因为普通梯度下降算法在垂直方向有波动，如果学习率太大会造成该方向波动较大，不利于收敛到最小值。动量梯度下降解决的问题是针对碗形函数执行梯度下降算法时，需要在直接下降到最小值方向的有较大下降而其垂直方向有较小波动。使用的方法是，进行加权平均，因为对于垂直方向加权平均的结果是接近于0正好抵消掉，对于直接下降到最小值的方向，正好累加使得下降加快。

网友评论

本文标题：深度学习 - 草稿 - 草稿

本文链接：https://www.haomeiwen.com/subject/ncdrxftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

深度学习 - 草稿 - 草稿

相关文章