美文网首页
协方差 标准差 相关系数

协方差 标准差 相关系数

作者: 默写年华Antifragile | 来源:发表于2019-04-19 18:47 被阅读0次

    参考:如何通俗易懂地解释「协方差」与「相关系数」的概念? - GRAYLAMB的回答 - 知乎
    https://www.zhihu.com/question/20852004/answer/134902061

    协方差:

    定义公式:\operatorname{Cov}(X, Y)=E\left[\left(X-\mu_{x}\right)\left(Y-\mu_{y}\right)\right]

    含义:

    • 值的正负表示 两个变量X, Y在变化的过程中是同方向变化?还是反方向变化?
      如公式所示,协方差是X, Y分别减去其均值再相乘,最后求均值,即X大于均值的时候,Y是否大于均值,以及大于均值多少
    • 值的大小表示同向或者反向变化的程度如何

    标准差:

    定义公式: \sigma_{X}=\sqrt{E\left(\left(X-\mu_{x}\right)^{2}\right)}

    X-\mu_{x} 表示偏离均值的幅度, 然后再平方是为了消除负号,然后再求期望,最后为了消除之前平方的影响,开根号
    因此, 标准差描述了变量在整体变化过程中偏离均值的幅度


    相关系数:

    定义公式:\rho=\frac{\operatorname{Cov}(X, Y)}{\sigma_{X} \sigma_{Y}}

    即:用X、Y的协方差除以X的标准差和Y的标准差。
    即:相关系数可以看成是协方差:一种剔除了两个变量量纲的影响,标准化后的特殊协方差
    因此,相关系数也具有协方差的性质:

    1. 其值的正负可以反映两个变量变化时是同向还是反向
    2. 由于相关系数是标准化后的协方差,因此其值在[-1,1]之间,就消除了两个变量变化幅度的影响,而只是单纯的反映每单位变化时的相似程度。
    • 当他们的相关系数为1时,说明两个变量变化时的正向相似度最大,即,你变大一倍,我也变大一倍;你变小一倍,我也变小一倍。也即是完全正相关(以X、Y为横纵坐标轴,可以画出一条斜率为正数的直线,所以X、Y是线性关系的)。
      随着他们相关系数减小,两个变量变化时的相似度也变小,当相关系数为0时,两个变量的变化过程没有任何相似度,也即两个变量无关。
      当相关系数继续变小,小于0时,两个变量开始出现反向的相似度,随着相关系数继续变小,反向相似度会逐渐变大。
      当相关系数为-1时,说明两个变量变化的反向相似度最大,即,你变大一倍,我变小一倍;你变小一倍,我变大一倍。也即是完全负相关(以X、Y为横纵坐标轴,可以画出一条斜率为负数的直线,所以X、Y也是线性关系的)。

    相关文章

      网友评论

          本文标题:协方差 标准差 相关系数

          本文链接:https://www.haomeiwen.com/subject/qxecgqtx.html