在上篇Stata系列-什么是BP检验、怀特检验?
我们介绍了如何检验异方差,接下我们来分析如何处理异方差。
1.使用OLS+稳健标准误
这是最简单,也是目前通用的方法。只要样本容量较大,即使在异方差的情况下,只要使用稳健标准误,所有的参数估计、假设检验均可以照常进行。
*导入数据集
use nerlove.dta, clear
*回归分析(稳健标准误)
reg lntc lnq lnpl lnpk lnpf,r

2.2加权最小二乘法(WLS)
思路:因为方差较小的观测值包含的信息量较大,因此可以给予方差较小的观测值较大的权重,然后进行加权最小二乘法估计。
处理:对于存在异方差的数据,通过变量转换,使得变换后的模型满足球形扰动项假定,即变为同方差,然后再进行OLS估计,便可以得到最有效率的BLUE
同时需要注意,WLS的R^2通常没有太大的意义,因为它衡量的是变换后的新解释变量,对此我们并不太感兴趣
求扰动项方差的估计值
*导入数据集
use nerlove.dta, clear
*回归分析
quietly reg lntc lnq lnpl lnpk lnpf
*计算残差,记为e1
predict e1,r
*计算残差平方,记为e2
gen e2 = e1^2
*将残差平方取对数
gen lne2 = log(e2)
*辅助回归
reg lne2 lnq

lnq虽然显著,但是R^2只有0.13,而且常数项不显著,因此去掉常数项,重新进行辅助回归
*辅助回归(去掉常数项)
reg lne2 lnq, noc

R^2为0.74,即lnq 可以解释lnei^2近75%的变动,即残差平方的变动与lnq高度相关
*计算以上回归拟合值,记为lne2f
predict lne2f
*计算方差估计值,记为e2f
gen e2f = exp(lne2f)
以上我们便得到了方差估计值e2f
接下来进行WLS
*WLS回归
reg lntc lnq lnpl lnpk lnpf [aw = 1/e2f]
aw = analytical weight 即权重

在这里我们可以对比下如果使用“OLS”
*导入数据集
use nerlove.dta, clear
*OLS回归分析
reg lntc lnq lnpl lnpk lnpf

对比可以得到,lnpk系数估计值由-0.22改进为-0.09(其理论值应为正数);lnpl的p值为0.13,在10%水平上不显著,换用WLS后,p值为0.002,在1%水平上显著不为0。由此可知WLS提高了估计效率,使得估计更有效了。
此外,如果担心条件方差函数的设定不准确,会导致加权变换后的新扰动项仍有一定的异方差,可以使用稳健标准误进行WLS估计
*WLS回归(稳健标准误)
reg lntc lnq lnpl lnpk lnpf [aw = 1/e2f], r

2.3可行加权最小二乘法(FWLS)
使用WLS的前提是必须知道每个个体的方差,但实践中我们通常不知道。因此WLS事实上是不可行的,需要先用样本数据估计个体方差,然后使用WLS
2.4用OLS+稳健标准误还是WFLS
OLS+稳健标准误更稳健,好比“万金油”,FWLS更有效率,好比“特效药”。因此对二者的选择是对稳健性和有效性的选择。
由于无法判断条件异方差的具体形式,因此“特效药”可能失效,甚至起到反作用。一旦对个体方差的估计不准确,FWLS即使在大样本下也不是BLUE,其估计效率可能还不如OLS。
因此大多数情况下,应使用OLS+文件标准误。如果确实存在严重的异方差,则可以通过FWLS来提高估计效率。同时若对于条件异方差函数具体形式没有把握,即不知道处理之后的新扰动项是否同方差,可以进行WLS回归时,仍使用异方差稳健的标准误,以保证FWLS标准误的有效性。
网友评论