1. 残差-识别回归模型好坏的关键
定义:在样本数据中,对均值估计的表达式和对观测值的表达式的差异可以用图2来表示。点(观测值)和回归线(平均值),二者的差别称为残差。注意残差与误差项不同,残差是样本数据中的,可以视为对总体模型中误差项的估计。
示例解读:
图2.观测值与回归线
(1)图中样本估计值和样本观测值的差值就是残差。每个点都与估计值有一个差值,因此12个点就有12个残差。很明显,残差越小,说明拟合的回归模型越好,因为它更贴近实际值。
(2)现实中,我们会更关心回归系数的大小,但残差却能告诉我们这些系数的估计值是否可靠。
2. 怎样去看残差图?
线性回归与残差(1)如在(a)图中,差值有上有下,反映在(b)图中就是围绕0随机波动的几个点。
总结:一条对数据点拟合好的回归线必然穿过这些点的中央,所有的点围绕这条线随机波动,反映在残差中就应该是围绕0随机波动,不应该有任何趋势。如果残差能看出趋势,则说明模型拟合肯定有问题。
总之残差是判断回归模型的关键。
网友评论