美文网首页程序员
相关性分析的TIPS

相关性分析的TIPS

作者: stagger_xu | 来源:发表于2018-12-12 16:26 被阅读0次

相关性分析

tips:相关性分析不要局限在数值型数据和数值型数据之间(散点图),还有其他的相关性可供分析:

1.数值型数据和数值型数据之间的相关性:用散点图。

2.分类变量和分类变量之间的相关性:用马赛克图。

3.分类变量和数值型变量之间的相关性:柱形图和箱线图。

1.直接绘制散点图

用 plot(kind = 'scattor')
或者
plt.scattor()

2.绘制散点图矩阵

用pandas 的 scatter_matrix() 功能

3.计算相关系数

(1) pearson相关系数 r 介于 -1 与 1 之间:

r>0 为 正相关,r = 1 为完全正线性相关
r<0 为 负相关, r = -1 为完全负线性相关
r=0 为 不相关

不同程度的线性相关:

| r | <= 0.3 为不存在线性相关
0.3 <| r |<= 0.5 为低度线性相关
0.5 <| r |<= 0.8 为显著线性相关
| r |>0.8 为高度线性相关

(2) Spearson 秩相关系数:
这个东西有点迷,目前没看懂。。。

(3) 判定系数:
判定系数是相关系数的平方,用r^2 表示。0<=r^2<= 1 越靠近1 表示x与y 的相关性越强,越靠近0 表示两个变量之间没有直线相关关系。

相关文章

网友评论

    本文标题:相关性分析的TIPS

    本文链接:https://www.haomeiwen.com/subject/peeuhqtx.html