相关性计算

作者: fatlady | 来源:发表于2019-03-07 10:30 被阅读7次

计算大量指标间的相关性,并以热图形式展示。
参考:http://www.sthda.com/english/wiki/correlation-matrix-a-quick-start-guide-to-analyze-format-and-visualize-a-correlation-matrix-using-r-software 【超赞的资料】

相关性热图
#计算相关性
require(Hmisc)
require(pheatmap)

d=read.table("example",header=T,row.names = 1)
head(d)
#        index1 index2 index3 index4 index5 index6 index7 index8 index9 index10
#sample1    134   3.60   29.3    9.0   55.8    2.7    0.4   1.05   0.32    2.01
#sample2    218   2.46   40.0    9.8   44.1    2.5    0.3   0.98   0.24    1.08
#sample3    185   3.74   46.7    6.5   37.5    5.7    1.1   1.75   0.24    1.40
#sample4    220   7.44   33.5    6.9   55.5    2.0    0.2   2.49   0.52    4.13
#sample5    228   4.23   37.4    4.5   53.9    1.3    0.3   1.58   0.19    2.28
#sample6    226   5.36   33.9    7.6   53.1    2.3    0.3   1.82   0.41    2.85

#index之间的相关性:得到相关性矩阵,可作热图/直接输出
res<-cor(d, use="pairwise.complete.obs") #默认method为pearson,可设置其他计算方法;针对缺失数据有不同处理方式
pheatmap(res)

#按列输出(方便筛选)
res2 <- rcorr(as.matrix(d))
out=flattenCorrMatrix(res2$r, res2$P)
head(out)
#     row column         cor           p
#1 index1 index2  0.53579901 0.002276657
#2 index1 index3 -0.06037896 0.751284491
#3 index2 index3 -0.30683542 0.099095706
#4 index1 index4 -0.01099476 0.954016664
#5 index2 index4 -0.14452340 0.446080828
#6 index3 index4  0.30426964 0.102098355

热图是根据相关性值做的,没有体现显著性值(p value),一般需要根据p值来进行筛选。

相关文章

  • R语言矩阵相关性计算及其可视化?

    1. 矩阵相关性计算方法 base::cor/cor.test R基础函数cor或cor.test都可计算相关性系...

  • R 相关性分析

    R 相关性分析 1. 相关性矩阵计算: 加载mtcars数据 计算两两相关系数 计算矩阵相关系数 2. 相关系数的...

  • numpy必知必会-第八天

    36 计算两列数据间的相关性 皮尔逊相关系数计算公式如下: 例如: 计算iris_2d第一列与第三列的相关性。 解...

  • ES doc的相关性

    什么是相关性? 我们曾经讲过,默认情况下,返回结果是按相关性倒序排列的。 但是什么是相关性? 相关性如何计算? 每...

  • 相关性计算

    计算大量指标间的相关性,并以热图形式展示。参考:http://www.sthda.com/english/wiki...

  • 搜索相关性得分

    介绍 本章将会介绍搜索的相关性得分,通过对不同算法的介绍来介绍es搜索背后的得分计算。 相关性 搜索的相关性算分,...

  • 数据点处理问题

    目的 我有一批数据,想看他们的相关性,计算相关性r后,发现相关性没有我自己想像中的好,所以我画了下散点图,发现有些...

  • Spark MLlib机器学习开发指南(2) --基本统计

    翻译自官方文档 如有问题,欢迎留言指正,转载请注明出处。 基本统计 目录 相关性 假设检验 相关性 计算两个数据...

  • TF-IDF和BM25

    搜索引擎总是会把相关性高的内容显示在前面,相关性低的内容显示在后面。那么,搜索引擎是如何计算关键字和内容的相关性呢...

  • pandas使用总结

    0、pandas常用方法 1、计算相关性 相关性,简单讲就是:正相关和负相关,值的大小在-1和1之间,越接近1,相...

网友评论

    本文标题:相关性计算

    本文链接:https://www.haomeiwen.com/subject/euwqpqtx.html