为了的得到OLS估计量的良好性质,CLRM(古典线性回归模型)需要做如下假定:
1.线性假定
要求回归函数是参数的线性函数
线性
若出现以下情况
平方项
互动项
函数形式1
两边取对数有
函数形式2
则可以做如下处理,变量“整体化“:
处理
2.严格外生性假定
严格外生性这意味着残差均值独立于所有解释变量的观测数据,即残差和所有个体的解释变量都不相关,即:
协方差
由迭代期望定律有
无条件期望
即残差的无条件期望为0
此外由协方差为0,还可以得到扰动项与解释变量正交: 正交
3.不存在严格多重共线性
即数据矩阵X列满秩,即各列向量为线性无关,不存在某个解释变量为另一个解释变量的倍数,或者可以由其他解释变量线性表出的情况。
对于多元回归,如果X列满秩,则X'X为正定矩阵,则X'X可逆,即(X'X)^-1存在,如此才能保证下式存在:
上面的论述中存在两个小证明:
1.X列满秩,则X'X为正定矩阵
证明:A为m*n矩阵
因为 r(A)=n, 所以 Ax≠0
所以 (Ax)'(Ax) > 0.
即有 x'A'Ax > 0
所以 A'A 为正定矩阵.
注: A' 即 A^T
2.X'X为正定矩阵,则X'X可逆
证明:A为正定矩阵
根据定义,正定的充分必要条件是其顺序主子式全大于0。即A正定, 必有 |A|>0,故 A 可逆
若(X'X)^-1不存在,则称 β“不可识别”
不存在严重的多重共线性是对数据的最低要求,现实数据中,并不容易出现。及时出现了,Stata也会自动识别,并提出多余变量。
网友评论