美文网首页
网络学习率变化策略

网络学习率变化策略

作者: Wangcy | 来源:发表于2016-12-01 23:43 被阅读0次

学习率变化有以下几种常见策略:

base_lr是基础学习率,这里设置为0.1。

1)“step” - 需要设置一个stepsize参数,返回base_lr * gamma ^ ( floor ( iter / stepsize ) ),iter为当前迭代次数,gamma设置为0.4,stepsize设置100;

2)“multistep”  和step相近,但是需要stepvalue参数,step是均匀等间隔变化,而multistep是根据stepvalue的值进行变化;

3)“fixed” - 保持base_lr不变;

4)“exp” - 返回base_lr * gamma ^ iter, iter为当前迭代次数,gamma设置为0.98;

5)“poly” - 学习率进行多项式误差衰减,返回 base_lr* ( 1 - iter / max_iter ) ^ ( power ),power设置为0.9;

6)“sigmoid” - 学习率进行sigmod函数衰减,返回 base_lr ( 1/ 1+exp ( gamma * ( iter - stepsize ) ) ),gamma设置为0.05,stepsize设置为200;

相关文章

网友评论

      本文标题:网络学习率变化策略

      本文链接:https://www.haomeiwen.com/subject/seefmttx.html