什么时候需要引入虚拟变量?
如果研究中使用了“定性数据”或“分类数据”,此时就需要引入“虚拟变量”
引入多少个虚拟变量呢?
在有常数项的莫行政,如果定性指标分为M类,则最多只能在回归方程中放入(M-1)个虚拟变量,否则就会产生严重的多重共线性。如果没有常数项,则可以放入M个虚拟变量。
假设样本中有四位个体,分别属于三类:
回归方程 虚拟变量陷阱
解决办法有:
- 去掉一个虚拟变量
- 去掉常数项
关于相关Stata操作
考虑一个有关中国经济的时间序列模型,经济结构在1978年改革开放后有变化,因此需要引入虚拟变量:
虚拟变量
gen d = (year > 1978)
假设有30个省份的名字储存于province,要为每一个省设立一个虚拟变量
tabulate province, gen(prov)
网友评论