背景
- 我在利用stata写实证文章的时候,容易遇到一个问题,就是在输出实证表格时,由于某些变量的缺失,导致输出的描述性统计的样本数和主回归的样本数不一致。
- 一个解决的办法是,对参与主回归的变量,若存在缺失,则删去缺失的样本。
- 只是,在一篇文章中,主回归之后,往往还有多个回归方程,如果把主回归的变量存在缺失值的样本全部删去,则可能会损失一些后续回归可能用得上的样本。
- 一个似乎更佳的办法是,标记参与了主回归的样本,单独对这部分样本进行描述性统计。
实现
sysuse auto, clear
su price rep78 weight length foreign
reg price rep78 weight length foreign
gen esample=1 if e(sample) //标记参与了回归的样本
su price rep78 weight length foreign if esample==1
网友评论