美文网首页
多元线性回归中截距项的问题

多元线性回归中截距项的问题

作者: 小梦游仙境 | 来源:发表于2020-06-12 17:58 被阅读0次

建模前,了解数据的基本情况,康康相关性。

corr <- cor(iris[,1:4])
corr
image-20200611195826319

建模

> lm2 <- lm(Petal.Length~.,data = iris[,1:4])
> summary(lm2)
#Petal.Length作为响应变量,.代表其他变量作为解释变量。
image-20200611194223302

截距修正

从上图可以看的截距项Intercept的p值为0.379,大于规定的显著水平0.05,所以需要将模型修正

lm3 <- lm(Petal.Length~.+0,data = iris[,1:4])
summary(lm3)
image-20200611194944862

上面的修正的回归模型中,将截距项去掉后,其他所有的参数p值均小于0.05很多,另外,R方知味0.9941,也说明回归效果很好。

  • 上面的回归方程就是,0.69421XS.L - 0.67286XS.W+1.46802XP.W

检验拟和值的同方差性

ncvTest(lm3)
image-20200611195523052

p值小于0.05,说明不存在拟和值的同方差性。

检测解释变量是否交互

在最开始的看变量间的相关性时,可以看到Petal.Width和Sepal.Length的相关性还是比较高的,达到了0.8179411,所以为了考虑二者的交互作用,则在解释变量中添加Petal.WidthSepal.Length*项

lm4 <- lm(Petal.Length~Petal.Width*Sepal.Length+Sepal.Width,data = iris[,1:4])
summary(lm4)
image-20200611200320654

上面可以看到得到的回归模型,截距项、三个解释变量及交互性均p值合格。

在交互项的选择上,原则是需要将解释变量进行组合,只要组合后R方值变大且有显著性意义就可以引入到回归模型中。交互项的选择适应于解释变量不多的情况下。

相关文章

  • 多元线性回归中截距项的问题

    建模前,了解数据的基本情况,康康相关性。 建模 截距修正 从上图可以看的截距项Intercept的p值为0.379...

  • 机器学习 - 线性回归梯度下降推导

    样本 x 有 m 个属性多元线性回归 线性回归模型函数 模型参数 属性(特征值)列表其中:是线性回归的截距的权重...

  • 相关系数与回归系数

    在一元线性回归中,自变量的标准回归系数与自变量和因变量之间的相关系数是一样的。但在多元线性回归中,由于自变量间通常...

  • 多元线性回归

    多元线性回归 从简单线性回归中,我们知道了,房价和面积可能有直接关系,除了面积还会有 地理位置,楼层,装修情况,...

  • 边际效应

    线性模型 连续变量假设解释变量对被解释变量的边际影响为常数。 虚拟变量 相当于不同的样本有不同的截距项。 交互项

  • Matlab一元/多元回归(后续会有更新)

    一元线性回归&一元非线性回归 多元回归/逐步回归 多元回归 先画散点图,看有没有线性性质,再决定能不能用多元线性回...

  • Python建模复习:预测型数据挖掘

    第四部分 预测性数据挖掘模型 回归问题:多元线性回归、多元非线性回归、广义线性回归、神经网络 分类问题:决策树、逻...

  • 线性回归中的共线性问题

    转自:知乎 https://zhuanlan.zhihu.com/p/22907932 突然想到,在实际情况中,对...

  • 2020-08-19--梯度下降法01

    梯度下降法简介 多元线性回归中的梯度下降法 随机梯度下降法 梯度下降法 的调试 1.梯度下降法简介 不是一个机器学...

  • 线性回归

    [Chapter 3 - 线性回归] 简单线性回归 形如,其中 截距为 为斜率, 和 被称为系数或者参数 计算模型...

网友评论

      本文标题:多元线性回归中截距项的问题

      本文链接:https://www.haomeiwen.com/subject/hgsntktx.html