Stata系列-如何处理多重共线性

Stata系列-如何处理多重共线性

作者: 5a41eb2ceec6 | 来源:发表于2018-08-12 18:23 被阅读118次

Stata系列-如何处理多重共线性
Stata系列-如何处理异方差？
Stata系列-如何处理结构变动
Stata系列-如何处理缺失值
Stata系列-如何处理遗漏变量
Stata系列-如何处理极端数据
Stata系列-如何处理自相关？
STATA技巧收集
Stata：毕业论文大礼包 A——实证结果输出命令大比拼
Stata：毕业论文大礼包 B——神速实证结果输出之搜狗短语

什么是多重共线性呢？
如果在解释变量中，有某一解释变量可由其他解释变量线性表出，则称存在“严重多重共线性”。

多重共线性有什么影响呢？
当存在多重共线性时，数据矩阵X不列满秩，(X’X)^-1 不存在，因此无法定义OLS估计量 β hat

多重共线性有什么表现“症状”？
1.整个方程的R² 较大，F检验也很显著，但是单个系数的t检验不显著
2.增减解释变量使得系数估计值发生较大变化

以上用数学语言刻画将表述如下：

方差

说明

说明

为此，我们定义解释变量x_k的“方差膨胀因子”（VIF）：

方差膨胀因子

关于该因子有以下经验规则：

经验规则

如何处理“多重共线性”？

如果不关心具体的回归系数，只关心整个方程预测被解释变量的能力，则通常不用理会多重共线性（假设整个方程是显著的）。因为多重共线性的主要后果是导致对单个变量的估计不准
如果关心具体的回归系数，但多重共线性并不影响所关心变量的显著性，也不用理会。
如果多重共线性影响到所关心变量的显著性，则应设法处理。
- 增加样本容量
- 剔除导致严重共线性的变量
- 将变量标准化
- 对模型假定进行修改

*导入数据集
use grilic.dta, clear
*回归分析
qui reg lnw s expr tenure iq smsa rns
*计算VIF
estat vif

VIF

由上表可知，最大的VIF为1.2，远远小于10，因此不用担心存在多重共线性

*引入教育年限的平方项
gen s2 = s^2
*回归分析
reg lnw s s2 expr tenure smsa rns

回归分析

从上表可以看出，教育年限和其平方项均不显著

*计算VIF
estat vif

VIF

从上表可以看出，s和s2对应的VIF分别达到167.07和166.30，远远大于10，因此存在多重共线性

进一步看看s2和s关系如何

*将s2对s回归
reg s2 s

s2和s

从上表中可以看到，R² = 0.9939，即s可以解释s2 99.9%的变动。这说明了s和s2包含的信息基本相同，因此导致严重的多重共线性

关于变量标准化
如果回归方程中包含解释变量的多项式，则通常会导致多重共线性，一个可能解决的办法就是将变量标准化：

变量标准化

*导入数据集
use grilic.dta, clear
*查看s的有关信息
sum s
*生成标准化变量sd
gen sd = (s-r(mean))/r(sd)
*生成标准化变量的平方项
gen sd2 = sd^2
*回归分析
qui reg lnw sd sd2 expr tenure smsa rns
*计算VIF
estat vif

VIF

由上表可以看出，VIF最大值为1.32，远小于10，可以认为不存在多重共线性

*将sd2对sd回归
reg sd2 sd

VIF

从上表中可以看到，R² = 0.1745 相对于先前的大大下降，此外由回归分析

回归分析
可知sd2不显著，因此接下来去掉sd2，保留sd，再次做回归分析

*回归分析
reg lnw sd expr tenure smsa rns

回归分析

由上表可知sd的回归系数为0.2291，因为sd为标准化标量，sd变化一单位，等价于s变化一个标准差，即2.231828

sd

对比未将s标准化的回归

对比

显然，是否将变量s标准化，对于回归结果没有任何实质性影响

相关文章

Stata系列-如何处理多重共线性
什么是多重共线性呢？如果在解释变量中，有某一解释变量可由其他解释变量线性表出，则称存在“严重多重共线性”。多重共...
Stata系列-如何处理异方差？
在上篇Stata系列-什么是BP检验、怀特检验？我们介绍了如何检验异方差，接下我们来分析如何处理异方差。 1.使用...
Stata系列-如何处理结构变动
假设背景是检验中国经济是否在1978年发生结构变动 1.邹检验原假设为：经济结构在这两个时期内没有变化，即“H0...
Stata系列-如何处理缺失值
对于缺失的数据，为保持样本容量，可以采用“线性插值”的方法以上是线性插值的简单原理，如果y有指数增长趋势，则应先...
Stata系列-如何处理遗漏变量
准备把模型设定和数据问题拆分成若干小部分，以下是第一部分“如何处理遗漏变量”，仅作理论上分析。在现实情况中，由于...
Stata系列-如何处理极端数据
什么是“极端数据”呢？如果样本数据中的少数观测值离大多数观测值很远，这些数据称为“极端观测值”或“高影响力数据”。...
Stata系列-如何处理自相关？
在上篇文章Stata系列-什么是BG 检验、Q检验、DW检验？（自相关）中介绍了“自相关”的相关知识，当我们通过检...
STATA技巧收集
1、数据处理 2、统计模型 3、模型检验如何用 Stata 做调节中介效应检验? 4、图形绘制
Stata：毕业论文大礼包 A——实证结果输出命令大比拼
Stata 结果输出系列推文：Stata：毕业论文大礼包 A——实证结果输出命令大比拼Stata：毕业论文大礼包 ...
Stata：毕业论文大礼包 B——神速实证结果输出之搜狗短语
Stata 结果输出系列推文：Stata：毕业论文大礼包 A——实证结果输出命令大比拼Stata：毕业论文大礼包 ...

网友评论

本文标题：Stata系列-如何处理多重共线性

本文链接：https://www.haomeiwen.com/subject/aflsbftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

计量经济学

热点阅读

计量经济学

Stata小小白

关于我们|服务条款|联系我们|Stata系列-如何处理多重共线性|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！