美文网首页
用Excel感受梯度下降的数据变化

用Excel感受梯度下降的数据变化

作者: 冠军的试练 | 来源:发表于2020-03-01 18:49 被阅读0次

梯度下降法是神经网络计算的基础,也是神经网络里面最有力的数学武器。为了更好地感受数据的变化,下面对函数z=x^2+y^2使用梯度下降法求出函数x和y的最小值。

其实就是找到某个特定函数的最小值

首先求出梯度(\frac{\partial z}{\partial x},\frac{\partial z}{\partial y}) = (2x,2y)

1. 初始设定

随便给出初始位置(x_i,y_i)(i=0)与学习率 \eta

图 1.1

2. 计算位移量

(\Delta x_i,\Delta y_i) = -\eta(\frac{\partial z}{\partial x},\frac{\partial z}{\partial y}) = -\eta(2x_i,2y_i),这个位移量可以看作是通过小步长来找出局部最小值。

图 1.2

3. 更新位置

当 i = 0 时,将当前位置 (x_{0},y_{0}) = (3.00,2.00) 与当前计算得到的位移向量(-0.60,-0.40)相加得到(2.40,1.60)
(x_{i+1},y_{i+1})=(x_{i},y_{i})+(\Delta x_i,\Delta y_i)

图 1.3

4. 反复执行2-3的操作

反复执行2-3的操作30次后得出坐标(x_{30},y_{30})的值。这个2-3反复过程地按照负梯度的倍数输入到z函数的过程被称为梯度下降。

图 1.4
使得函数z在点(0,0)处取得最小值 0

5. 关于学习率 \eta 与步长

\eta 看作步长实际上是不正确的,梯度下降法的步长是不均匀的,梯度在不同的位置大小不同。梯度下降让函数向局部最小值收敛,正如图1.5沿着山谷下降的过程一样。此处列举的山谷下降过程与上述的图1.4坐标数据是不同的,实际情况下人工神经网络的代价函数是非常复杂的。

假设特定函数的山谷下降过程 1.5
如果将上面第二步的式子

变形为


将梯度修改为单位向量,就可以将 看作步长了。
以上公式的定义都是由其可微性推导出来的,在微分学中,

在这里面要把 A和B分别看作为


或者

其实就是用式子Adx+Bdy的线性增量近似值去逼近\Delta z,而\Delta z的真实增量是式子

注意dz|_{(x_0,y_0)}只是逼近\Delta z,并不能说它们等价,会存在误差

这样就能推导出

\Delta x,\Delta y分别趋近于0时,取极限

当分子比分母更高阶无穷小时,等式为0。由于我要求出负梯度的值,现在我把式子变成

由变量\eta的取值决定函数要迈出步子有多大,这样把梯度修正为单位向量也就能将 \eta 看作步长了。

以上列举的内容只是为了以后更好地理解代价函数对权重、偏置的微小变化有多敏感。

\Delta x,\Delta y看作是函数z在某点处的瞬时变化率,而\frac{\partial z}{\partial x}理解为代价函数 z\Delta x微小变化的敏感度,或者换句话说,求zx_i的偏导数,可以把\frac{\partial z}{\partial x}当做改变\Delta xz函数值造成的变化,这两个数的比值,从概念上来说就是\Delta x的微小变化会导致z函数产生一些变化,如果这个z函数是一个很复杂的复合函数,那么它也会像神经网络单元一样导致隐含层产生微小的变化,最终影响到代价函数值。上面的描述对 \frac{\partial z} {\partial y} 同理。

相关文章

  • 用Excel感受梯度下降的数据变化

    梯度下降法是神经网络计算的基础,也是神经网络里面最有力的数学武器。为了更好地感受数据的变化,下面对函数使用梯度下降...

  • (三)线性回归--梯度下降

    一、梯度下降 二、代码的实现 (一.梯度下降) 导包 构建数据 梯度下降 使用梯度下降,可视化 (二。梯度下降矩阵...

  • 线性回归

    梯度下降 Learning rate越小,变化越慢 closed-form solution 解析解 梯度下降算法...

  • 更新权重的方式

    1、SGD 梯度下降(收敛最慢稳定) 梯度下降:+=- * d J() 批量梯度下降:将数据集切分为多批次, 分别...

  • 梯度下降与excel

    对应excel文件 获取链接 链接:https://pan.baidu.com/s/1jF7jUZ_IRSGOqU...

  • 2019-03-17神经网络——optimizer

    神经网络优化算法,通常有三种:小批量梯度下降法,随机梯度下降法和批量梯度下降法。 小批量梯度下降法 适用于训练数据...

  • 统计学习方法2.2-4.1 笔记

    2.2 感知机 -- 准备知识:梯度下降法 梯度下降法是求解无约束问题的最常用方法 最大变化率是梯度大小,也就是梯...

  • 最速下降和梯度下降

    梯度下降只是最速下降的一个子集,梯度下降用的是欧式范数。但是很多时候起始点的梯度并不代表过程中的梯度,所以有的时候...

  • 深入浅出--梯度下降法及其实现

    梯度下降的场景假设梯度梯度下降算法的数学解释梯度下降算法的实例梯度下降算法的实现Further reading 本...

  • 神经网络优化2

    梯度下降 梯度下降法 批梯度下降法(Batch Gradient Descent,BGD)是最常用的梯度下降形式,...

网友评论

      本文标题:用Excel感受梯度下降的数据变化

      本文链接:https://www.haomeiwen.com/subject/nskxhhtx.html