在关于模型的解释变量个数选择上,我们需要权衡模型解释力和模型简洁性。可供选择的标准有:
- 校正可决系数
- 赤池信息准则(AIC)
- 贝叶斯信息准则(BIC)
- 由小到大的序贯t规则
信息准则
*导入数据集
use icecream.dta, clear
*回归分析
quietly reg consumption temp price income
*信息准则
estat ic
data:image/s3,"s3://crabby-images/2c09a/2c09a664d66c3149f89e9ee30431e16b32194bd9" alt=""
*加入气温一阶滞后项
quietly reg consumption temp L.temp price income
*信息准则
estat ic
data:image/s3,"s3://crabby-images/7f95b/7f95b057a85ce3ed1dd6c03177c22757c50e3bf1" alt=""
*加入气温二阶滞后项
quietly reg consumption temp L.temp L2.temp price income
*信息准则
estat ic
data:image/s3,"s3://crabby-images/a0774/a0774ebad2f51e202f46faa0a04db8dc6fa5177b" alt=""
从以上结果可以得到以下信息
- 增加气温一阶滞后项后,AIC、BIC都下降了
- 再增加气温二阶滞后项后,AIC、BIC相比反而上升了
因此从信息准则的角度,应该包含气温一阶滞后项,但是不能再引入更高阶的气温滞后项
由小到大的序贯t规则
data:image/s3,"s3://crabby-images/8e1a0/8e1a0f5c96374a1530f660daf1cf5386ddd1e678" alt=""
*序贯t规则(pmax=2)
reg consumption temp L.temp L2.temp price income
data:image/s3,"s3://crabby-images/62068/62068c98ffc1dbcc1e87619baf34f9a7b1489d52" alt=""
由上边可知,L2.temp的系数高度不显著,因此取p hat = pmax -1 = 1,重新进行估计
*序贯t规则(pmax=1)
reg consumption temp L.temp price income
data:image/s3,"s3://crabby-images/bc8e7/bc8e70124e6fd559d66e6f21116d728c016a35a1" alt=""
从上边可知,L.temp的系数在1%水平上显著,故最终选择p hat = 1
网友评论