在概率论和统计学中,相关(Correlation,或称相关系数或关联系数),显示两个随机变量之间线性关系的强度和方向(in common usage it most often refers to how close two variables are to having a linear relationship with each other)。用图形来解释,如下:
正相关、负相关、不相关相关系数r( correlation coefficient (r) ),通常用于表征两个变量线性关系的强度,用图形表示,如下:
其相关系数的数值强度表如下:
最常见的相关系数是Pearson's r,其全称为: Pearson product-moment correlation coefficient, 或者 "Pearson's correlation coefficient", 通常简称为"the correlation coefficient(相关系数)"。其数学定义为:
相关系数ρ其中,σ是标准差, con(X,Y)是协方差,E是数学期望。
当两个变量的标准差都不为零,相关系数才有定义。从柯西-施瓦茨不等式可知,相关系数的绝对值不超过1。当两个变量的线性关系增强时,相关系数趋于1或-1。当一个变量增加而另一变量也增加时,相关系数大于0。当一个变量的增加而另一变量减少时,相关系数小于0。当两个变量独立时,相关系数为0,但反之并不成立。这是因为相关系数仅仅反映了两个变量之间是否线性相关
网友评论