统计-R(相关系数)与R^2(决定系数)傻傻分不清

作者: PriscillaBai | 来源:发表于2018-06-09 16:08 被阅读212次

读文献时,有时求相关系数,有时求拟合优度,到底都是什么呢?

先给结论,R与R^2没有关系,就如同标准差与标准误差没有关系一样。

1. 相关系数(R)

  • 定义:变量之间线性相关的度量。分三种,spearman, pearson, kendall
  • 公式: image.png
  • 解释:自变量X和因变量Y的协方差/标准差的乘积。
    * 协方差:两个变量变化是同方向的还是异方向的。X高Y也高,协方差就是正,相反,则是负。
    * 为什么要除标准差:标准化。即消除了X和Y自身变化的影响,只讨论两者之间关系。
    * 因此,相关系数是一种特殊的协方差。

2. 决定系数(R^2)

  • 定义:对模型进行线性回归后,评价回归模型系数拟合优度。

  • 公式:R2=SSR/SST=1-SSE/SST
    SST (total sum of squares):总平方和
    SSR (regression sum of squares):回归平方和
    SSE (error sum of squares) :残差平方和。

  • 解释:残差(residual):实际值与观察值之间的差异

    • 在一组数据中,采用平均值做基线模型(图中黑线)
      我们的模型(蓝线)都与这个黑线比较,来判断模型的好坏
    • var=sum(i-mean)^2
image.png
  • 结论:R^2=81%,因变量Y的81%变化由我们的自变量X来解释。
  • R^2 的缺陷:当我们人为的向系统中添加过多的自变量,SSE会减少,从而R^2变大。因此我们采用校正R方,惩罚了过多无意义的自变量:


    image.png

相关文章

  • 统计-R(相关系数)与R^2(决定系数)傻傻分不清

    读文献时,有时求相关系数,有时求拟合优度,到底都是什么呢? 先给结论,R与R^2没有关系,就如同标准差与标准误差没...

  • 4、拟合

    13、决定系数R2 既然用相关系数R了为什么还要有R2 ? 我们很难看出r=0.7和r=0.5的两倍一样好 但是我...

  • 相关性分析

    简单相关分析的基本步骤如下: 统计-r(相关系数)与R^2的区别 r与R^2没有关系,就如同标准差与标准误差没有关...

  • 相关性系数和它的朋友们

    本文内容是基于statquest-协方差与相关系数的学习笔记,介绍协方差、相关系数和R^1三个统计量,并添加了R语...

  • 第十五章 多元线性回归分析

    这一章首先介绍多元线性回归的及其基本统计量,偏回归系数,决定系数R方及adjusted R方,接着对各自变量的作用...

  • correlation

    相关分析是用相关系数(r)来表示两个变量间相互的直线关系,并判断其密切程度的统计方法。相关系数r没有单位。在-1~...

  • 学习小组Day4-沈荣

    R语言基础 1.R与Rstudio的安装 2.了解R与Rstudio ①R语言: R是一种编程语言,也是统计计算和...

  • linux,R,python傻傻分不清

    有时候我不一定能及时回复,但没回复的消息我一般会置顶聊天记录,闲下来会一一回复。最近有多个朋友问我这个问题: 其实...

  • R语言相关性的度量

    R可以计算多种相关系数,包括pearson相关系数、Spearman相关系数、Kendall相关系数、偏相关系数、...

  • R与统计

    用R实现:产生100个N(50,25)随机数,并给出其描述性统计量,画出正态分布概率图

网友评论

本文标题:统计-R(相关系数)与R^2(决定系数)傻傻分不清

本文链接:https://www.haomeiwen.com/subject/rsvteftx.html