美文网首页
Ada_grad自适应梯度下降

Ada_grad自适应梯度下降

作者: Co酱_秋乏术 | 来源:发表于2023-03-13 18:29 被阅读0次

    def sgd_adagrad(parameters, sqrs, lr):

    eps = 1e-10

    for param, sqr in zip(parameters, sqrs):

      sqr[:] = sqr + param.grad.data ** 2

      div = lr / torch.sqrt(sqr + eps) * param.grad.data

      param.data = param.data - div

    相关文章

      网友评论

          本文标题:Ada_grad自适应梯度下降

          本文链接:https://www.haomeiwen.com/subject/ziwcrdtx.html