美文网首页
计算梯度的方法+BackPropagation

计算梯度的方法+BackPropagation

作者: 我好菜啊_ | 来源:发表于2019-02-15 14:45 被阅读0次

参考cs231n与这位的博文https://www.zhihu.com/people/will-55-30/posts?page=1 非常感谢!


为找到最好的W,即使Li最小的W,使用梯度下降法
梯度是偏导数组成的向量
计算梯度->更新W 循环迭代进行这个过程
计算梯度有两个方法

  • 数值法


    数值法计算梯度
  • 微积分法
    loss是关于W的函数,可以求导



    首先初始化W为随机值,计算损失和梯度,然后向梯度相反的方向更新权重值
    步长是一个超参数,也被称作学习率learning rate,每次计算出梯度时,在那个方向移动多少距离


minibatch
每次迭代时只选取一小部分样本来进行运算


back propagation求gradient
每个节点出的gradient都是local gradient乘以后一个节点的gradient



可以将好几个节点合并



当一个节点前向影响好几个分支时

模块化的实现,对于网络中的每个节点都有一个前向API用于计算loss,后向API用于计算梯度



CNN中的每一层的实现其实也就是这样一个个模块化的forward/backward API
forward: compute result of an operation and save any intermediates needed for gradient computation in memory
backward: apply the chain rule to compute the gradient of the loss function with respect to the inputs

相关文章

  • 计算梯度的方法+BackPropagation

    参考cs231n与这位的博文https://www.zhihu.com/people/will-55-30/pos...

  • Backword&Forward

    Backpropagation:计算梯度时,链式规则的递归应用 Forward:计算运算的结果并保存,留给梯度计算...

  • 机器学习分享——反向传播算法推导

    反向传播(英语:Backpropagation,缩写为BP)是“误差反向传播”的简称,是一种与最优化方法(如梯度下...

  • 反向传播

    反向传播(英語:Backpropagation,缩写为BP)是“误差反向传播”的简称,是一种与最优化方法(如梯度下...

  • 图像处理小词典

    梯度/梯度算子:这里的梯度特指二维离散函数中的梯度,因此就不能用连续函数的算法计算,而是要用差分的方法。计算方法有...

  • 2018-06-28 BP算法

    BP推导——续 反向传播算法 Backpropagation Algorithm (批量)梯度下降法 (batch...

  • 图像边缘提取的实现

    前言 在图像梯度和边缘提取的文章中,详细介绍了关于图像梯度和边缘提取的计算方法,这种计算方法依赖卷积运算,根据实际...

  • 3.2 损失函数和优化:优化

    计算函数的梯度,用这些题都迭代,更新参数向量。在计算机上,计算梯度的一个有效方法是有限差分法。设想W是现在的向量参...

  • 2018-11-21 Backpropagation-反向传播算

    1.1 为什么要用 Backpropagation 在神经网络中求解最优模型参数,使用的梯度下降算法和之前求线性回...

  • 梯度消失和梯度爆炸及解决方案

    一、为什么会产生梯度消失和梯度爆炸 目前优化神经网络的方法都是基于BP,即根据损失函数计算的误差通过梯度反向传播的...

网友评论

      本文标题:计算梯度的方法+BackPropagation

      本文链接:https://www.haomeiwen.com/subject/zwppeqtx.html