美文网首页工作生活
coefficient of determination 回归分

coefficient of determination 回归分

作者: 鲸鱼酱375 | 来源:发表于2019-07-02 23:10 被阅读0次

    决定系数:

    拟合优度越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。观察点在回归直线附近越密集。

    为了判定模型拟合的好坏,用r^2判定,越大拟合效果越好

    image.png

    1.平方和

    平方和表示对距离均值的变异或离差的度量。计算方法是与均值之差的平方之和。计算总平方和时,同时考虑来自因子和来自随机性或误差的平方和。

    2.方差分析中的平方和

    在方差分析 (ANOVA) 中,总平方和有助于表达可能因不同因子所致的总变异。例如,运行试验以检验三种洗衣粉的效果。

    总平方和 = 处理平方和 (SST) + 残差误差平方和 (SSE)

    处理平方和是因处理(在此例中为洗衣粉之间的不同)所致的变异。残差误差平方和是因误差所致的变异。

    通过除以自由度将平方和转换为均方,可以对这些比率进行比较,并确定是否因洗衣粉而导致显著差异。此比率越大,处理对结果的影响越大。

    3.回归中的总平方和

    在回归中,总平方和有助于表达 y 的总变异。例如,您收集数据以确定将总体销售解释为广告预算函数的模型。

    总平方和 = 回归平方和 (SSR) + 残差误差平方和 (SSE)

    image

    回归平方和是因 x 与 y 之间关系(本例中为广告预算与销售额之间)所致的变异。残差误差平方和是因误差所致的变异。

    通过将回归平方和与总平方和进行比较,确定总变异中由回归模型解释的比率(R2,确定性系数)。此值越大,将销售额解释为广告预算的函数的关系越好。

    4.残差平方和(又称误差平方和,SSE,Sum of Squares for Error): 也是rss

    因变量的各实际观测值(给定点的Y值)与回归值(回归直线上的Y值)的差的平方和,它是除了x对y的线性影响之外的其他因素对y变化的作用,不能由回归直线来解释的。

    SSE越小,Y¡′对Y¡的拟合度越高,回归直线保留的因变量信息越多。

    总结:
    tss= ess+rss 总平方和= 回归平方和+误差平方和
    回归平方和:SSR(Sum of Squares forregression) = ESS (explained sum of squares)
    残差/误差平方和:SSE(Sum of Squares for Error) = RSS(residual sum of squares)
    总离差平方和/总平方和:SST(Sum of Squares fortotal) = TSS(total sum of squares)
    SSE+SSR=SST RSS+ESS=TSS

    r是相关系数,r^2不是他的平方,因为r^2可以是负值

    reference:
    https://zhuanlan.zhihu.com/p/24886209
    https://blog.csdn.net/snowdroptulip/article/details/79022532
    https://blog.csdn.net/theonegis/article/details/85991138
    👆这个讲的比较好

    相关文章

      网友评论

        本文标题:coefficient of determination 回归分

        本文链接:https://www.haomeiwen.com/subject/wzwocctx.html