美文网首页
论文泛读:《Fixing Weight Decay Regula

论文泛读:《Fixing Weight Decay Regula

作者: 月牙眼的楼下小黑 | 来源:发表于2018-12-16 21:49 被阅读61次

简 介: 在标准 SGD 优化算法中, L2 正则 等效于 Weight decay , 但在自适应梯度下降算法中, 如 Adam, 这种情况不再成立。 现有流行深度框架对 Adamweight decay 的实现均是错误的, 我们对其做了一个简单的修正, 将 weight decay 和损失函数解耦, 提升了 Adam 的泛化性能。


相关文章

网友评论

      本文标题:论文泛读:《Fixing Weight Decay Regula

      本文链接:https://www.haomeiwen.com/subject/iwtfkqtx.html