准备把模型设定和数据问题拆分成若干小部分,以下是第一部分“如何处理遗漏变量”,仅作理论上分析。
在现实情况中,由于某些数据难以获得,因此遗漏变量无法避免。假设解释变量为x1 ,遗漏变量是x2,我们需要考虑以下两种情形:
- x2和x1不相关。此时,OLS依然可一致地估计回归系数,但是由于x2被包含在扰动项中,可能增大扰动项的方差,影响到OLS估计的精确度
- x2和x1相关。此时,根据大样本理论,OLS估计不一致,造成“遗漏变量偏差”,这会成为实证研究的“致命伤”。
如何解决遗漏变量偏差问题呢?方法主要有:
- 加入尽可能多的控制变量
- 随机实验与自然实验
- 工具变量法
- 使用面板数据
1.加入尽可能多的控制变量
首先从理论出发,列出所有可能对被解释变量有影响的变量,然后尽可能地去收集数据。如果有些数据确实无法获得,就需要从理论上说明,遗漏变量不会与解释变量相关,或者相关性很弱。
2.随机实验与自然实验
随机实验虽然说服力强,但是成本通常较高。自然实验是指由于某些为了实验目的而发生的外部突发事件,使得当事人方法被随机分在了实验组或控制组。
3.工具变量法
将在随后进行介绍
4.面板数据
将在随后进行介绍
网友评论