对于缺失的数据,为保持样本容量,可以采用“线性插值”的方法
![](https://img.haomeiwen.com/i11013023/f15a748277d83aad.png)
以上是线性插值的简单原理,如果y有指数增长趋势,则应先去对数,再用lny进行线性插值。如果需要用y进行回归,则对线性插值得到的数值取反对数即可。
*导入数据集
use consumption.dta, clear
*生成缺失值
gen y1 = y
replace y1 =. if year == 1980 | year == 1990 | year == 2000 | year == 2010
*对数化处理
gen lny1 = log(y1)
*线性插值
ipolate lny1 year, gen(lny2)
*反对数处理
gen y2 = exp(lny2)
*对比
list year y y2 if year == 1980 | year == 1990 | year == 2000 | year == 2010
![](https://img.haomeiwen.com/i11013023/9a50a3c357329166.png)
网友评论