美文网首页
数据的相关分析

数据的相关分析

作者: 闫_锋 | 来源:发表于2018-05-17 21:27 被阅读12次

相关分析
两个事物,表示为X和Y, 如何判断它们之间的存在相关性?

  • X增大, Y增大,两个变量正相关
  • X增大, Y减小,两个变量负相关
  • X增大, Y无视,两个变量不相关

协方差
两个事物,表示为X和Y,如何判断它们之间的存在相关性?

cov(X,Y)

  • 协方差>0, X和Y正相关
  • 协方差>0, X和Y负相关
  • 协方差=0, X和Y独立无关

Pearson相关系数
两个事物,表示为X和Y,如何判断它们之间的存在相关性?
r取值范围[-1, 1]
0.8 ~ 1.0极强相关
0.6 ~ 0.8强相关
0.4 ~ 0.6中等程度相关
0.2 ~ 0.4弱相关
0.0 ~ 0.2极弱相关或无相关

相关分析函数
适用于Series和DataFrame类型

.cov() #计算协方差矩阵
.corr() #计算相关系数矩阵,Pearson, Spearman, Kendall等系数

房价增幅和M2增幅的相关性

import pandas as pd
hprice = pd.Series([3.04, 22.93, 12.75, 22.6, 12.33], index = ['2008', '2009', '2010', '2011', '2012'])

m2 = pd.Series([8.18, 18.38, 9.13, 7.82, 6.69], index = ['2008', '2009', '2010', '2011', '2012'])

hprice.corr(m2)

#画图

相关文章

网友评论

      本文标题:数据的相关分析

      本文链接:https://www.haomeiwen.com/subject/xjbidftx.html