美文网首页统计分析与数据挖掘
统计学(74)-识别回归模型的好坏

统计学(74)-识别回归模型的好坏

作者: Zhigang_Han | 来源:发表于2020-04-10 18:57 被阅读0次
    1. 残差-识别回归模型好坏的关键

    定义:在样本数据中,对均值估计的表达式和对观测值的表达式的差异可以用图2来表示。点(观测值)和回归线(平均值),二者的差别称为残差。注意残差与误差项不同,残差是样本数据中的,可以视为对总体模型中误差项的估计。
    示例解读:

    图1.数据集
    图2.观测值与回归线
    (1)图中样本估计值和样本观测值的差值就是残差。每个点都与估计值有一个差值,因此12个点就有12个残差。很明显,残差越小,说明拟合的回归模型越好,因为它更贴近实际值。
    (2)现实中,我们会更关心回归系数的大小,但残差却能告诉我们这些系数的估计值是否可靠。
    2. 怎样去看残差图?
    线性回归与残差
    (1)如在(a)图中,差值有上有下,反映在(b)图中就是围绕0随机波动的几个点。
    总结:一条对数据点拟合好的回归线必然穿过这些点的中央,所有的点围绕这条线随机波动,反映在残差中就应该是围绕0随机波动,不应该有任何趋势。如果残差能看出趋势,则说明模型拟合肯定有问题。
    总之残差是判断回归模型的关键

    相关文章

      网友评论

        本文标题:统计学(74)-识别回归模型的好坏

        本文链接:https://www.haomeiwen.com/subject/yrfdmhtx.html