经过最近三年学者们的研究,我们现在可以得到一个结论。
这个结论可以用来解释为什么使用简单的动量法就可以训练出来模型。
何为深度
深度 > 3 的就可以称之为深度模型
REF
本文标题:深度学习非凸优化的特点
本文链接:https://www.haomeiwen.com/subject/bzuxdttx.html
网友评论