机器学习中的三种梯度下降法

机器学习中的三种梯度下降法

作者: 51fb659a6d6f | 来源:发表于2017-12-11 21:10 被阅读0次

2020-08-19--梯度下降法01
机器学习学习笔记（六）梯度下降法
2019-03-17神经网络——optimizer
如何手写梯度下降法
机器学习中的三种梯度下降法
局部搜索之梯度下降法
机器学习中的梯度下降法
机器学习系列（十四）——梯度下降法Gradient Descen
快速理解梯度下降法
用人话讲明白梯度下降Gradient Descent（以求解多元

姓名：尤学强学号：17101223374

转载自：http://mp.weixin.qq.com/s/DbAagAvzwy8iNYzeA1A8RA

【嵌牛导读】：采用梯度下降法来对采用的算法进行训练

【嵌牛鼻子】：函数，算法

【嵌牛提问】：怎样才是最优算法？

【嵌牛正文】：

在应用机器学习算法时，我们通常采用梯度下降法来对采用的算法进行训练。其实，常用的梯度下降法还具体包含有三种不同的形式，它们也各自有着不同的优缺点。

下面我们以线性回归算法来对三种梯度下降法进行比较。

一般线性回归函数的假设函数为：

对应的损失函数为：

（这里的1/2是为了后面求导计算方便）

下图作为一个二维参数（theta0，theta1）组对应能量函数的可视化图：

下面我们来分别讲解三种梯度下降法

1

批量梯度下降法BGD

我们的目的是要误差函数尽可能的小，即求解weights使误差函数尽可能小。首先，我们随机初始化weigths，然后不断反复的更新weights使得误差函数减小，直到满足要求时停止。这里更新算法我们选择梯度下降算法，利用初始化的weights并且反复更新weights：

这里代表学习率，表示每次向着J最陡峭的方向迈步的大小。为了更新weights，我们需要求出函数J的偏导数。首先当我们只有一个数据点（x,y）的时候，J的偏导数是：

则对所有数据点，上述损失函数的偏导（累和）为：

再最小化损失函数的过程中，需要不断反复的更新weights使得误差函数减小，更新过程如下：

那么好了，每次参数更新的伪代码如下：

由上图更新公式我们就可以看到，我们每一次的参数更新都用到了所有的训练数据（比如有m个，就用到了m个），如果训练数据非常多的话，是非常耗时的。

下面给出批梯度下降的收敛图：

从图中，我们可以得到BGD迭代的次数相对较少。

2

随机梯度下降法SGD

由于批梯度下降每跟新一个参数的时候，要用到所有的样本数，所以训练速度会随着样本数量的增加而变得非常缓慢。随机梯度下降正是为了解决这个办法而提出的。它是利用每个样本的损失函数对θ求偏导得到对应的梯度，来更新θ：

更新过程如下：

随机梯度下降是通过每个样本来迭代更新一次，对比上面的批量梯度下降，迭代一次需要用到所有训练样本（往往如今真实问题训练数据都是非常巨大），一次迭代不可能最优，如果迭代10次的话就需要遍历训练样本10次。

但是，SGD伴随的一个问题是噪音较BGD要多，使得SGD并不是每次迭代都向着整体最优化方向。

随机梯度下降收敛图如下：

我们可以从图中看出SGD迭代的次数较多，在解空间的搜索过程看起来很盲目。但是大体上是往着最优值方向移动。

3

min-batch 小批量梯度下降法MBGD

我们从上面两种梯度下降法可以看出，其各自均有优缺点，那么能不能在两种方法的性能之间取得一个折衷呢？既算法的训练过程比较快，而且也要保证最终参数训练的准确率，而这正是小批量梯度下降法（Mini-batch Gradient Descent，简称MBGD）的初衷。

我们假设每次更新参数的时候用到的样本数为10个（不同的任务完全不同，这里举一个例子而已）

更新伪代码如下：

4

实例以及代码详解

这里参考他人博客，创建了一个数据，如下图所示：

待训练数据A、B为自变量，C为因变量。

相关文章

2020-08-19--梯度下降法01
梯度下降法简介多元线性回归中的梯度下降法随机梯度下降法梯度下降法的调试 1.梯度下降法简介不是一个机器学...
机器学习学习笔记（六）梯度下降法
基础（1）梯度下降法本身不是一个机器学习算法（2）梯度下降法是一种基于搜索的最优化方法（3）梯度下降法的作用...
2019-03-17神经网络——optimizer
神经网络优化算法，通常有三种：小批量梯度下降法，随机梯度下降法和批量梯度下降法。小批量梯度下降法适用于训练数据...
如何手写梯度下降法
梯度下降法是机器学习的一种学习方法。我觉得非常妙。通过一个一维的问题用梯度下降法，理解学习过程是怎样的。假设g是...
机器学习中的三种梯度下降法
姓名：尤学强学号：17101223374 转载自：http://mp.weixin.qq.com/s/DbAag...
局部搜索之梯度下降法
在各种最优化算法中，梯度下降法是最常见的一种，在深度学习的训练中被广为使用。梯度下降法的场景假设梯度下降法的基本...
机器学习中的梯度下降法
机器学习中的大部分问题都是优化问题，而绝大部分优化问题都可以使用梯度下降法（Gradient Descent）处理...
机器学习系列（十四）——梯度下降法Gradient Descen
梯度下降法梯度下降法本身不是一个机器学习算法，而是一种基于搜索的最优化方法，它是人工智能领域非常重要的一种方法。...
快速理解梯度下降法
1. 梯度下降法的抽象理解梯度下降法（Gradient descent）是深度学习中的最基础的工具之一，它是一种...
用人话讲明白梯度下降Gradient Descent（以求解多元
文章目录1.梯度2.多元线性回归参数求解3.梯度下降4.梯度下降法求解多元线性回归梯度下降算法在机器学习中出现频...

网友评论

嵌牛IT观察

本文标题：机器学习中的三种梯度下降法

本文链接：https://www.haomeiwen.com/subject/ctpwixtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

嵌牛IT观察

关于我们|服务条款|联系我们|机器学习中的三种梯度下降法|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！