美文网首页
几种情况可以不用考虑逻辑回归下的线性相关性

几种情况可以不用考虑逻辑回归下的线性相关性

作者: 九日照林 | 来源:发表于2020-01-30 11:55 被阅读0次

共线性问题

共线性问题是在构建线性模型当中常见的问题,共线性问题是指预测变量之间存在着线性相关性导致模型预测的相关系数不准确的问题。

如何诊断共线性

目前诊断共线性常用的方法就是方差膨胀因子(variance inflation factor)。方差膨胀因子的计算公式为:

VIF=\frac{1}{1-R^2}

它的计算方式是遍历所有的自变量,用除了该自变量以外的其他自变量构建一个模型来预测该自变量,可以得到该自变量对应的一个R^2以及对应的方差膨胀因子VIF

代表的意义是相对于完全不相关(R^2=0VIF=1),用其他自变量预测该自变量得到的VIF「膨胀了多少」。

例如,假如说某个变量计算出的VIF为2.5,那么也就是R^2相对于完全不相关的情况下的R^2膨胀了125%。

VIF与共线性的关系

在不同的情况下VIF需要达到多少值才认为具有共线性,这个问题并没有统一的标准,每个人都有不同的见解。但一般来说,VIF为2.5需要关注一下,这个时候R^2为0.6。

什么情况下高VIF不是问题

我们之所以要排除线性相关性强的变量,是因为线性相关性强的变量会扩大相关系数的方差,使得模型的预测不稳定。

第一点,高线性相关性只存在于控制变量之间,而不存在于我们研究的相关变量间。控制变量可以认为是一个无关的变量的时候。比如我们想研究私立/公立高中对大学的毕业率的影响,前面一个变量是自变量,是分类变量;后者是自变量。但同时也有SAT成绩和ACT成绩。后面这两个变量SAT成绩和ACT成绩是高度相关的,并且也会显著影响大学毕业率,那么就是我们要控制的变量,但是和「私立/公立学校」这个变量无关。

那么这个时候SAT成绩和ACT成绩如果都是随机抽取的话,私立或者公立下的毕业率就会相当于是控制了SAT成绩和ACT成绩这两个变量下的结果。

第二点,当你引入了变量组合之间的指数或者乘积的时候。比如有个自变量x,z,以及xz还有x^2,那么这也会产生高VIF,但是这也是不用考虑的。

第三点,如果预测变量为分类变量,并且用来作为参考的变量的数量占比很少。举个例子,假如有个分类变量为婚姻状况,独热编码后为「已结婚」,「未结婚」,「已离婚」。其中占比分别为0.45, 0.45以及0.1。那么以「已离婚」作为预测的变量之一,无论是用「已离婚」+「已结婚」去预测「未结婚」,还是用「已离婚」+「未结婚」去预测「已结婚」,「已结婚」和「未结婚」都明显呈现出负相关性。他们之间的VIF至少是3.0,这种情况下的VIF也是可以不用考虑的。

相关文章

  • 几种情况可以不用考虑逻辑回归下的线性相关性

    共线性问题 共线性问题是在构建线性模型当中常见的问题,共线性问题是指预测变量之间存在着线性相关性导致模型预测的相关...

  • 机器学习浅尝

    建立在有高等数学、线性代数的基础下,可以从线性回归、逻辑回归开始突破。线性回归用于解决预测型问题。逻辑回归用于解决...

  • FFM算法

    1、FM 1.1 背景 1.1.1 线性模型 常见的线性模型,比如线性回归、逻辑回归等,它只考虑了每个特征对结果的...

  • 回归的分类

    一、回归可以分为以下几类 1.线性回归 2.非线性回归 3.逻辑回归 二、回归的概念 1.线性回归 可以简单理解为...

  • 机器学习day7-逻辑回归问题

    逻辑回归 逻辑回归,是最常见最基础的模型。 逻辑回归与线性回归 逻辑回归处理的是分类问题,线性回归处理回归问题。两...

  • 逻辑回归

    逻辑回归 线性回归 to 逻辑回归 本质:逻辑回归的本质就是在线性回归的基础上做了一个非线性的映射(变换),使得算...

  • 算法概述-02

    1.逻辑回归和线性回归的联系和区别: 逻辑回归和线性回归的都是广义的线性回归。 线性回归是根据最小二乘法来建模,逻...

  • Task 01|基于逻辑回归的分类预测

    知识背景 关于逻辑回归的几个问题 逻辑回归相比线性回归,有何异同? 逻辑回归和线性回归最大的不同点是逻辑回归解决的...

  • demo1: Tensorflow实现Linear regres

    Linear Regression 回归主要分为线性回归和逻辑回归。线性回归主要解决连续值预测问题,逻辑回归主要解...

  • Logistic回归

    在之前我已经写了一篇关于线性回归的文章,今天给大家带来另一个重要的回归分类算法----逻辑回归逻辑回归考虑的数值情...

网友评论

      本文标题:几种情况可以不用考虑逻辑回归下的线性相关性

      本文链接:https://www.haomeiwen.com/subject/otsjthtx.html