美文网首页
逻辑回归(logistic regression)

逻辑回归(logistic regression)

作者: 可能性之兽 | 来源:发表于2022-04-22 13:21 被阅读0次

对逻辑回归(logistic regression)的理解 - 知乎 (zhihu.com)

什么是逻辑回归?

假设因变量Y为服从二项分布,进行了n次测量,每一次y(单个事件)的取值要么成功要么失败。p为事件成功的概率, X为因变量。


image.png

这个等式就称为logit(p)逻辑回归。逻辑回归是一种因变量与事件发生的概率之间的一种映射关系。其中的p/(1-p),称为odds,即事件成功的概率除以事件失败的概率。
为什么要有逻辑回归呢?

在统计学中,事件发生的概率是大家所关心的重要问题之一。当因变量y服从二项分布的时候,每一次事件的结果只有两个,比如要么发生要么不发生,要么成功要么失败,在这个例子中将每一次的结果视为0或者1。 相信大多数人关心的是事件发生的几率有多大,概率是多少。但是线性回归不会把y的值看作为0或者1的分类数据,而是把0或者1当成普普通通的数字。这个时候线性回归就不再适合。而逻辑回归正是架起了事件成功或发生(或者属于某个分类)的概率与因变量之间的线性关系。

概率是怎么与因变量联系上的?

可能单单看上面的逻辑回归等式很难直观的理解到底是怎么将变量的线性关系与概率联系上的。下面我们来做一些简单的变换:

对公式的右边log这一块进行求幂,再对公式的两边进行求倒:

image.png

为什么不直接用概率p要用log(odds)呢?

Odds 在统计学中是一个很早就存在的概念。它也是预测某件事件发生的方式之一。大概概率是最直观的,所以目前是最为人熟知的。既然逻辑回归中模拟的是自变量与事件发生的概率的关系,那为什么要用log(odds)而不用log(p)呢?

1, odds的取值范围为(0,+Inf),log(odds)的取值范围为(-Inf, +Inf)。线性模型就可以映射到(-Inf, +Inf), 使线性模型得到了延伸。而log(p)的取值为(-Inf, 0)。那么关于自变量的线性模型就会有所限制

2, 用odds ratio 有很多统计学好处。逻辑回归的内部实现也是基于odds ratio
如何对逻辑回归进行解读?

案例:

从 Odds 角度理解 Logistic Regression 模型的参数 (vividfree.github.io)

image.png

深入理解逻辑回归算法(Logistic Regression) - 掘金 (juejin.cn)

image.png

从图中可以看出,如果把逻辑回归转化为 log(odds),有两点明显的变化:

log(odds) 是一条直线
log(odds) 可以将逻辑回归的值域从 (0, 1) 拓宽到 (-∞, +∞)

逻辑回归和贝叶斯分类本质是一样的,都是后验模型

image.png

这些解读真是精彩:
(一)逻辑回归结果 —— 回归系数表 - 简书 (jianshu.com)
(二)读懂逻辑回归结果 —— 哪个变量值得关注 - 简书 (jianshu.com)
(三)读懂逻辑回归结果 —— 评估自变量的影响 - 简书 (jianshu.com)
(四)读懂逻辑回归结果 —— 作出预测 - 简书 (jianshu.com)
(五)读懂逻辑回归结果 —— 不确定性的评估 - 简书 (jianshu.com)

第 58 章 logistic回归模型 | 数据科学中的 R 语言 (bookdown.org)

相关文章

网友评论

      本文标题:逻辑回归(logistic regression)

      本文链接:https://www.haomeiwen.com/subject/qpagertx.html