美文网首页
[ML] LR 为什么用 sigmoid ?

[ML] LR 为什么用 sigmoid ?

作者: 原来是酱紫呀 | 来源:发表于2019-11-06 21:52 被阅读0次

1. 思路

The point of this quick post is to write out why using the log-odds is infact very well motivated in the first place, and once it is modeled by a linear function, what you get is the logistic function.
Beginning with log-odds would infact be begging the question, so let us try to understand.

2. 结论

log-odds 是个很自然的选择,sigmoid 是对 log-odds 的线性建模。(事实逻辑回归可以说是the log-odds with a linear function的最简单的例子,如果我们有结构化输出,这种模型的自然扩展将是the Conditional Random Field。使用线性函数的选择只是在其他一些有利的属性中凸优化)。

3. 理解

假设我们有一个线性分类器:

我们要求得合适的W和w_0 ,使 0-1 loss 的期望值最小,即下面这个期望最小:

其中,一对 x y 的 0-1 loss 为: 那么, 由 链式法则 变换如下: 为了最小化 R(h),只需要对每个 x 最小化它的条件风险: 由 0-1 loss 的定义,当 h(x)不等于 c 时,loss 为 1,否则为 0,所以上式变为: 由于, 所以, 为了使 条件风险 最小,就需要 p 最大,也就是需要 h 为:

值得注意的是,到目前为止,我们对数据完全没有做出任何假设。 所以上面的分类器就新样本点的预期损失而言,是我们在泛化方面可以拥有的最佳分类器。 这种分类器称为贝叶斯分类器,有时也称为Plug-in 分类器。

上面的问题等价于 找到 c*,使右面的部分成立: 取 log 得: 特殊情况,为二分类时:

我们得到了 log-odds ratio !
请注意,通过不对数据做出任何假设,只需写出条件风险,log-odds ratio 就会直接下降。 这不是偶然的,因为最佳贝叶斯分类器具有用于二进制分类的这种形式。 但问题仍然存在,我们如何模拟这个对数比值比? 最简单的选择是考虑线性模型(there is no reason to stick to a linear model, but due to some reasons, one being convexity, we stick to a linear model):

接下来就是对 log-odds ratio 进行建模,最简单的就是想到线性模型: 重新排列,产生熟悉的逻辑模型(和sigmoid):

由此可见,log-odds 是个很自然的选择,sigmoid 是对 log-odds 的线性建模。

参考:https://onionesquereality.wordpress.com/2016/05/18/where-does-the-sigmoid-in-logistic-regression-come-from/

相关文章

  • [ML] LR 为什么用 sigmoid ?

    1. 思路 The point of this quick post is to write out why us...

  • 点击率预测综述-摘记

    lr模型优缺点 lr 的优点很明确,首先 sigmoid 函数的取值范围是 0-1,刚好可以解释为点击概率,而输入...

  • Logistic Regression

    推导 sigmoid 推导LR损失函数 推导LR梯度下降 Softmax原理 softmax 损失函数 softm...

  • 58面试算法

    1.LR中的函数为什么用sigmoid,替换成别的可以吗?在训练时候注意那几点?单机下对一个大文件,如何找出top...

  • xgboost

    LR 通过sigmoid函数将线性回归的结果映射到[0, 1]之间,得到预测为正样本的概率值; 本质上,是利用线性...

  • 机器学习之sigmoid函数

    先说一下,ML小白。 这是第一次写个人博客类似东西, 主要来说说看 sigmoid 函数,sigmoid...

  • 2.2常用算法--逻辑回归(分类/解决二分类问题)

    ☆☆☆☆☆逻辑回归 (LR)(分类/解决二分类问题) 一. sigmoid函数(逻辑回归函数) 1.t 就是线性回...

  • 逻辑回归之Sigmoid推导

    序 本次记录的内容包括: 逻辑回归目标函数sigmoid的来源 解释为何LR是对数线性模型 多角度推导sigmoi...

  • Spark ML LR 用 setWeightCol 解决数据不

    前言 如题,记录在Spark ML LR中如何解决数据不平衡。参考:Dealing with unbalanced...

  • 信用模型总结

    一模型方法 (1)LR-逻辑回归,线性回归原理一样。 Sigmoid函数:公式如下,作用就是把Y转换成0-1之间(...

网友评论

      本文标题:[ML] LR 为什么用 sigmoid ?

      本文链接:https://www.haomeiwen.com/subject/tcryyctx.html