在做回归时,很多时候会有的情况,这也意味着不满足外生性条件,此时的OLS估计量就不再满足无偏性,并且随着的变大,它的bias也无法变小。若对此无法理解,请先掌握《小样本OLS回归梳理》中的内容。
此时该怎么办?一种解决方法是利用一些与无关的变量,这就是工具变量(instrumental variables,下文统称IV)。我们假设找到的IV是一些的向量,再将它排成的矩阵。
IV需要与原来的足够接近,因此(为矩阵)必须满列秩。而我们寻找IV的目的,就是要让IV满足,由数据生成过程可知,我们要求解的就是满足的。
我们无法知道和,但可以用样本矩代替,即
上面的方程,若,则有多个解,若且非奇异,则有唯一解,若,无解。在经济学理论中,往往会出现的情形,此时尽管方程无解,但我们依旧可以寻找,使尽可能接近。
我们可以定义一个和之间的二次距离:
其中是一个的正定范数矩阵(positive definite norming matrix),它可以是随机矩阵。这里之所以选择二次距离,是因为这样在求解最优化问题时比较方便,可以直接写出一阶条件:
假设非奇异,就可以得到IV估计量
只要选择和,就可以得到各种计量经济学中的估计量。比如选择和,那么就变成了OLS估计量。而选择,就得到了2SLS(two-stage least squares)估计量。
IV估计量是无偏的吗?在数据生成过程下,有
事实上,上式的第二项我们没有理由保证它为,哪怕有也无法保证。但在假设、(为有限满列秩矩阵)以及(为有限正定矩阵)之后,可以得到比无偏性更弱的一致性:。
网友评论