机器学习之梯度下降算法

作者: Sunshine丶宇天 | 来源:发表于2019-08-28 17:31 被阅读0次

梯度下降算法的理解
机器学习之梯度下降算法
梯度下降算法
机器学习之梯度下降算法
机器学习之梯度下降算法
用人话讲明白梯度下降Gradient Descent（以求解多元
「机器学习笔记」梯度下降 Gradient Descent
梯度下降求解线性回归
机器学习学习笔记（六）梯度下降法
[机器学习入门] 李宏毅机器学习笔记-3 （Gradient D

梯度下降的场景假设

一个人被困在山上，需要从山上下到山谷。但此时山上的雾很大，导致可视度很低。因此，下山的路径就无法确定，他必须利用自己周围的信息去找到下山的路径。这个时候，他就可以利用梯度下降算法来帮助自己下山。以他当前的所处的位置为基准，寻找这个位置最陡峭的地方，然后朝着山的高度下降的地方走，如果我们的目标是上山，也就是爬到山顶，那么此时应该是朝着最陡峭的方向往上走。然后每走一段距离，都反复采用同一个方法，最后就能成功的抵达山谷。

模拟下山.png

梯度下降简介

梯度下降是迭代法的一种,可以用于求解最小二乘问题(线性和非线性都可以)。在求解机器学习算法的模型参数，即无约束优化问题时，梯度下降（Gradient Descent）是最常采用的方法之一，另一种常用的方法是最小二乘法。在求解损失函数的最小值时，可以通过梯度下降法来一步步的迭代求解，得到最小化的损失函数和模型参数值。反过来，如果我们需要求解损失函数的最大值，这时就需要用梯度上升法来迭代了。

求解过程

梯度下降法的计算过程就是沿梯度下降的方向求解极小值（也可以沿梯度上升方向求解极大值）。
梯度方向我们可以通过对函数求导得到，步长的确定比较麻烦，太大了的话可能会发散，太小收敛速度又太慢。一般确定步长的方法是由线性搜索算法来确定。
梯度向量为0的话说明是到了一个极值点，此时梯度的幅值也为0.而采用梯度下降算法进行最优化求解时，算法迭代的终止条件是梯度向量的幅值接近0即可，可以设置个非常小的常数阈值。

梯度下降.png

代码实现梯度下降算法

造测试数据代码如下：

import numpy as np
import matplotlib.pyplot as plt

plot_x = np.linspace(-1, 6 , 200)
plot_y = (plot_x - 2.5) ** 2 - 1
plt.plot(plot_x, plot_y)
plt.show()

可视化测试数据：

测试数据.png

梯度下降算法求解这个测试数据的极值点，算法迭代的终止条件是梯度向量的幅值接近0即可，可以设置个非常小的常数阈值。

import numpy as np
import matplotlib.pyplot as plt

plot_x = np.linspace(-1, 6 , 200)
plot_y = (plot_x - 2.5) ** 2 - 1

#设置个非常小的常数阈值
epsilon = 1e-8
#设置步长
eta = 0.2

# 损失函数
def J(theta):
    return (theta-2.5)**2 - 1.

# 求导确认行进方向
def dJ(theta):
    return 2*(theta-2.5)

theta = 0.0
theta_history = [theta]
while True:
    gradient = dJ(theta)
    last_theta = theta
    # 向导数的负方向移一步  
    theta = theta - eta * gradient
    theta_history.append(theta)
    
    # 终止条件是梯度向量的幅值接近0，我们设置的是小于epsilon 即可
    if(abs(J(theta) - J(last_theta)) < epsilon):
        break

plt.plot(plot_x, J(plot_x))
plt.plot(np.array(theta_history), J(np.array(theta_history)), color="r", marker='*')
plt.show()

梯度下降效果如下：