美文网首页
多重共线性(multicollinearity)问题

多重共线性(multicollinearity)问题

作者: 北欧森林 | 来源:发表于2021-05-29 02:49 被阅读0次

建立多元线性回归的前提之一是:不存在多重共线性(Multicollinearity)。检验变量之间是否存在共线性问题可以使用方差膨胀因子(Variance inflation factor, VIF)。其计算和作图代码如下:

安装、加载R包

# install.packages("performance")
# install.packages("see")
library(performance)
library(see)
  1. mtcars数据集为例,建立回归模型
linear_model <- lm(mpg ~ cyl + disp + hp + drat, data = mtcars)
  1. 计算VIF
check_collinearity(linear_model)
# # Check for Multicollinearity
# 
# Low Correlation
# 
# Parameter  VIF Increased SE
# hp      3.99         2.00
# drat    2.50         1.58
# 
# Moderate Correlation
# 
# Parameter  VIF Increased SE
# cyl    7.76         2.79
# disp  6.23         2.50
  1. 可视化VIF结果
plot(check_collinearity(linear_model))
image.png

结果解读:方差膨胀因子(Variance inflation factor, VIF)可以用于诊断变量间是否存在多重共线性。通常来说,VIF >5 或者 VIF > 10 则提示存在对模型造成危害的共线性问题。本例中 如果以VIF > 10作为存在共线性问题的标准,可以使用上述4个变量进行建模。

参考资料

  1. 微信公众号“R语言和统计”: 如何进行回归的多重共线性检验?这种清新脱俗的方法值得拥有!
  2. Package ‘performance’

相关文章

  • 多重共线性(multicollinearity)问题

    建立多元线性回归的前提之一是:不存在多重共线性(Multicollinearity)。检验变量之间是否存在共线性问...

  • 皮尔森相关系数

    多个属性间的相关性很高(相关系数>0.7),即多重共线性(multicollinearity),往往会导致预测结果...

  • 从做蛋糕到多重共线性(Multicollinearity)

    如果你不要看文章,只要订蛋糕,那就加wechat: wyywenyi。(限湾区,限湾区。我最喜欢你这种人了?) 0...

  • 出现多重共线性问题,如何处理?

    在进行线性回归分析时,容易出现自变量(解释变量)之间彼此相关,这种情况被称作多重共线性问题。 适度的多重共线性不成...

  • 在Python中实现多重共线性的可视化

    在Python中实现多重共线性的可视化 网络图的胜利。 简介什么是多重共线性? 多重共线性是指两个或更多的特征之间...

  • 【问题积累】

    1.多重共线性 @2020-2-15 问题来源:pandas.get_dummies函数中的drop_firs...

  • 多重共线性、异方差和自相关性

    1.多重共线性 多重共线性是解释变量存在线性关系或者近似的线性关系,多重共线性影响的模型一般为底层是线性的模型,例...

  • 岭回归

    岭回归 岭回归和lasso解决回归中重大疑难问题:排除多重共线性,进行变量的选...

  • 多重共线性问题相关

    多元回归分析中的共线性问题 原创 2015-11-13 ccccfys spss统计分析 多重共线性:回归模型中,...

  • Stata系列-如何处理多重共线性

    什么是多重共线性呢?如果在解释变量中,有某一解释变量可由其他解释变量线性表出,则称存在“严重多重共线性”。 多重共...

网友评论

      本文标题:多重共线性(multicollinearity)问题

      本文链接:https://www.haomeiwen.com/subject/hnpjsltx.html