决定系数:
拟合优度越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。观察点在回归直线附近越密集。
为了判定模型拟合的好坏,用判定,越大拟合效果越好
image.png1.平方和
平方和表示对距离均值的变异或离差的度量。计算方法是与均值之差的平方之和。计算总平方和时,同时考虑来自因子和来自随机性或误差的平方和。
2.方差分析中的平方和
在方差分析 (ANOVA) 中,总平方和有助于表达可能因不同因子所致的总变异。例如,运行试验以检验三种洗衣粉的效果。
总平方和 = 处理平方和 (SST) + 残差误差平方和 (SSE)
处理平方和是因处理(在此例中为洗衣粉之间的不同)所致的变异。残差误差平方和是因误差所致的变异。
通过除以自由度将平方和转换为均方,可以对这些比率进行比较,并确定是否因洗衣粉而导致显著差异。此比率越大,处理对结果的影响越大。
3.回归中的总平方和
在回归中,总平方和有助于表达 y 的总变异。例如,您收集数据以确定将总体销售解释为广告预算函数的模型。
总平方和 = 回归平方和 (SSR) + 残差误差平方和 (SSE)
image回归平方和是因 x 与 y 之间关系(本例中为广告预算与销售额之间)所致的变异。残差误差平方和是因误差所致的变异。
通过将回归平方和与总平方和进行比较,确定总变异中由回归模型解释的比率(R2,确定性系数)。此值越大,将销售额解释为广告预算的函数的关系越好。
4.残差平方和(又称误差平方和,SSE,Sum of Squares for Error): 也是rss
因变量的各实际观测值(给定点的Y值)与回归值(回归直线上的Y值)的差的平方和,它是除了x对y的线性影响之外的其他因素对y变化的作用,不能由回归直线来解释的。
SSE越小,Y¡′对Y¡的拟合度越高,回归直线保留的因变量信息越多。
总结:
tss= ess+rss 总平方和= 回归平方和+误差平方和
回归平方和:SSR(Sum of Squares forregression) = ESS (explained sum of squares)
残差/误差平方和:SSE(Sum of Squares for Error) = RSS(residual sum of squares)
总离差平方和/总平方和:SST(Sum of Squares fortotal) = TSS(total sum of squares)
SSE+SSR=SST RSS+ESS=TSS
r是相关系数,不是他的平方,因为可以是负值
reference:
https://zhuanlan.zhihu.com/p/24886209
https://blog.csdn.net/snowdroptulip/article/details/79022532
https://blog.csdn.net/theonegis/article/details/85991138
👆这个讲的比较好
网友评论