Logistic回归与梯度上升算法

Logistic回归与梯度上升算法

作者: 吴烨JS | 来源:发表于2017-05-27 23:31 被阅读0次

Logistic回归与梯度上升算法
机器学习之logistic回归的梯度上升算法
《机器学习实战》第五章梯度上升算法的直观理解
机器学习实践笔记--Logistic回归
Logistic回归与最大熵模型-优化算法
吴恩达深度学习 2.9-2.14
机器学习实战教程（六）：Logistic回归实战篇之预测病马死亡
机器学习实战——Logistic回归
逻辑回归与梯度下降详解
Andrew Ng ML(3)——Logistic回归

在《机器学习实战》一书的第5章中讲到了Logistic用于二分类问题。书中只是给出梯度上升算法代码，但是并没有给出数学推导。故哪怕是简单的几行代码，依然难以理解。

对于Logistic回归模型而言，需要读者具有高等数学、线性代数、概率论和数理统计的基础的数学基础。高等数学部分能理解偏导数即可；线性代数部分能理解矩阵乘法及矩阵转置即可；概率论和数理统计能理解条件概率及极大似然估计即可。

有《高等代数》(浙大)、概率论与数理统计(浙大)、线性代数(同济大学)三本数学足矣。

Logistic回归用于二分类问题，面对具体的二分类问题，比如明天是否会下雨。人们通常是估计，并没有十足的把握。因此用概率来表示再适合不过了。

Logistic本质上是一个基于条件概率的判别模型(DiscriminativeModel)。利用了Sigma函数值域在[0,1]这个特性。

函数图像为：

通过sigma函数计算出最终结果，以0.5为分界线，最终结果大于0.5则属于正类(类别值为1)，反之属于负类(类别值为0)。

如果将上面的函数扩展到多维空间，并且加上参数，则函数变成：

其中X是变量，θ是参数，由于是多维，所以写成了向量的形式，也可以看作矩阵。θT表示矩阵θ的转置，即行向量变成列向量。θTX是矩阵乘法。（高数结合线性代数的知识）

如果我们有合适的参数向量θ，以及样本x，那么对样本x分类就可以通过上式计算出一个概率值来，如果概率值大于0.5，我们就说样本是正类，否则样本是负类。

比如，对于“垃圾邮件判别问题”，对于给定的邮件(样本)，我们定义非垃圾邮件为正类，垃圾邮件为负类。我们通过计算出的概率值即可判定邮件是否是垃圾邮件。

接下来问题来了，如何得到合适的参数向量θ呢？

由于sigma函数的特性，我们可作出如下的假设：

上式即为在已知样本X和参数θ的情况下，样本X属性正类(y=1)和负类(y=0)的条件概率。

将两个公式合并成一个，如下：

既然概率出来了，那么最大似然估计也该出场了。假定样本与样本之间相互独立，那么整个样本集生成的概率即为所有样本生成概率的乘积：

其中，m为样本的总数，y(i)表示第i个样本的类别，x(i)表示第i个样本，需要注意的是θ是多维向量，x(i)也是多维向量。

（接下来从《概率论与数理统计》转到《高等数学》）

为了简化问题，我们对整个表达式求对数，(将指数问题对数化是处理数学问题常见的方法)：

上式是基本的对数变换，高中数学而已，没有复杂的东西。

满足似然函数(θ)的最大的θ值即是我们需要求解的模型。

梯度上升算法

如此复杂的函数，如何求满足函数(θ)最大值的参数向量θ呢？

如果问题简化到一维，就很好办了。假如需要求取函数：

的最大值。

函数图像如下：

函数的导数为：

所以x=1.5即取得函数的最大值1.25

但是真实环境中的函数不会像上面这么简单，就算求出了函数的导数，也很难精确计算出函数的极值。此时我们就可以用迭代的方法来做。就像爬坡一样，一点一点逼近极值。爬坡这个动作用数学公式表达即为：

其中，α为步长。

求上面函数极值的Python代码如下：

1

2

3

4

5

6

7

8

9

10

11

12deff_prime(x_old):

return-2*x_old+3

defcal():

x_old=0

x_new=6

eps=0.01

presision=0.00001

whileabs(x_new-x_old)>presision:

x_old=x_new

x_new=x_old+eps*f_prime(x_old)

returnx_new

结果为：1.50048

回到Logistic Regression问题，我们同样对函数求偏导。

这个公式有点复杂，但是依然只是基本的导数变换，待我细细拆解。这里需要的数学知识无外乎两点：函数的和、差、积、商求导法则和复合函数的求导法则(高等数学P88页)。

先看：

其中：

再由：

可得：

接下来就剩下第三部分：

(这个公式应该很容易理解，简单的偏导公式)

还有就是：

综合三部分即得到：

因此，梯度迭代公式为：

相关文章

Logistic回归与梯度上升算法
在《机器学习实战》一书的第5章中讲到了Logistic用于二分类问题。书中只是给出梯度上升算法代码，但是并没有给出...
机器学习之logistic回归的梯度上升算法
机器学习之logistic回归的梯度上升算法原文地址：blog.csdn.net/tianse12/articl...
《机器学习实战》第五章梯度上升算法的直观理解
第五章讲的是Logistic 回归，作者提出了梯度上升算法，本文是对该算法的一个通俗易懂的解释，不需要任何梯度的知...
机器学习实践笔记--Logistic回归
Logistic回归主要内容Sigmoid函数和Logistic回归分类器最优化理论初步梯度下降最优化算法数据中...
Logistic回归与最大熵模型-优化算法
Logistic回归与最大熵模型-理论推导中提到了4个优化算法：分别是：梯度下降算法拟牛顿法（牛顿法）通用迭...
吴恩达深度学习 2.9-2.14
2.9-2.10 logistic回归中的梯度下降法：课件： [神经网络基础 2.9 logistic回归中的梯...
机器学习实战教程（六）：Logistic回归实战篇之预测病马死亡
一、改进的随机梯度上升算法梯度上升算法在每次更新回归系数(最优参数)时，都需要遍历整个数据集。可以看一下我们之前...
机器学习实战——Logistic回归
【主要内容】 Sigmoid函数和Logistic回归分类器最优化理论初步梯度下降最优算法数据中的缺失项处理...
逻辑回归与梯度下降详解
逻辑回归 Sigmoid函数：梯度：梯度上升算法到达每个点后都会重新计算移动的方向，不断迭代移动，直到满足停止...
Andrew Ng ML(3)——Logistic回归
Logistic回归（）——分类算法 (Logistic function/sigmoid function)由图...

网友评论

本文标题：Logistic回归与梯度上升算法

本文链接：https://www.haomeiwen.com/subject/qktzxxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Logistic回归与梯度上升算法|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！