我们需要确保随机梯度下降是收敛的,我们需要选取合适的α。
我们需要每多少个样本,计算一次代价函数平均值,然后看它是否收敛。我们可以通过此来调整学习率α。
本文标题:随机梯度下降收敛(Stochastic gradient des
本文链接:https://www.haomeiwen.com/subject/riusyxtx.html
网友评论