美文网首页
R相关性分析

R相关性分析

作者: wo_monic | 来源:发表于2021-10-11 14:14 被阅读0次

两组时间向量相关性分析(皮尔逊分析)

setwd("circos/test")
#install.packages("ggpubr")
library("ggpubr")
data1 <- read.table("check.table",header = T,sep="\t")
head(data1)

检测两个变量是否符合正态分布(看散点是否分布在阴影中,是,则是正态分布)

# gene
ggqqplot(data1$Gene_coverge, ylab = "gene coverge")
# LTR
ggqqplot(data1$LTR_percent, ylab = "LTR")

检测数据是否符合正态分布,p<0.05,不符合正态分布;p>0.05,符合正态分布

shapiro.test(data1$Gene_coverge) # => p = 2.2e-16
shapiro.test(data1$LTR_percent) # => p = 2.2e-16

经过两种方法检测,本数据不符合正态分布,所以不能使用pearson检测相关性。所以使用kendall和spearman.

皮尔逊方法,本实验不适用

if (FALSE){
  res <- cor.test(data1$Gene_coverge, data1$LTR_percent,  method = "pearson")
  res
  #cor 是皮尔逊相关系数-0.9668788 (1正相关,-1负相关),df是自由度,p-value< 2.2e-16
  ggscatter(data1, x = "Gene_coverge", y = "LTR_percent", 
            add = "reg.line", conf.int = TRUE, 
            cor.coef = TRUE, cor.method = "pearson",
            xlab = "gene coverge", ylab = "LTR percent")
  
}

kendall方法

res2 <- cor.test(data1$Gene_coverge, data1$LTR_percent,  method = "kendall")
res2
#tau是肯德尔相关系数-0.8825434 ,p-value<2.2e-16
p2 <- ggscatter(data1, x = "Gene_coverge", y = "LTR_percent", 
          add = "reg.line", conf.int = TRUE, 
          cor.coef = TRUE, cor.method = "kendall",
          xlab = "gene coverge", ylab = "LTR percent")

spearman方法

res3 <- cor.test(data1$Gene_coverge, data1$LTR_percent,  method = "spearman")
res3
#rho是spearman相关系数-0.9799782 ,p-value < 2.2e-16
p3 <- ggscatter(data1, x = "Gene_coverge", y = "LTR_percent", 
          add = "reg.line", conf.int = TRUE, 
          cor.coef = TRUE, cor.method = "spearman",
          xlab = "gene coverge", ylab = "LTR percent")+labs(title = "Correlation analysis of LTR and gene density")

#cowplot::plot_grid(p2,p3,nrow=2,labels=c("a","b"))
ggsave("LTR_gene_coverge.check.pdf",dpi = 300)
ggsave("LTR_gene_coverge.check.tiff")

data0 <- read.table("check3.table",header = T,sep = "\t")
ggscatter(data0, x = "Gene_coverge", y = "Gypsy", 
          add = "reg.line", conf.int = TRUE, 
          cor.coef = TRUE, cor.method = "spearman",
          xlab = "gene coverge", ylab = "Gypsy")+labs(title = "Correlation analysis of Gypsy and gene density")
ggsave("gypsy_gene_coverge.pdf")
不在阴影区,说明不符合正态分布

对整个数据框各组变量都进行相关性分析

K<- read.csv("test.csv")
cor_data <- cor(K,method = "kendall")
library(corrplot)
corrplot(cor_data, method="circle",type="lower")
corrplot(cor_data, method="pie",type="lower")
corrplot(cor_data, method="number")

corrplot method参数"circle", "square", "ellipse", "number", "shade", "color", "pie" ;type参数; "full", "lower", "upper"

相关文章

  • R语言-相关系数计算(一)

    应用R语言完成相关性检验,相关性矩阵及相关性可视化首先安装相应的R包 相关性分析的方法Pearson correl...

  • R 相关性分析

    相关性分析 结果

  • R 相关性分析

    R 相关性分析 1. 相关性矩阵计算: 加载mtcars数据 计算两两相关系数 计算矩阵相关系数 2. 相关系数的...

  • R相关性分析

    1.理论部分 Pearson(默认) 最常规的线性分析。计算公式 适用条件 变量线性关系、连续 两个变量总体符合正...

  • R - 相关性分析

    相关性分析用于评估两个或多个变量之间的关联性。 1. 两个变量的相关性分析 参数相关性检验( parametric...

  • R相关性分析

    两组时间向量相关性分析(皮尔逊分析) 检测两个变量是否符合正态分布(看散点是否分布在阴影中,是,则是正态分布) 检...

  • 统计学-三大相关系数

    参考:1.ref12.微信:新年开工——相关性分析了解一下?成对数据的相关性分析流程: 计算相关系数,主要用R里的...

  • R语言之可视化(31)扫地僧easystats(2)相关性分析

    R语言之可视化(30)扫地僧easystats(1) 介绍 相关性是一个专注于相关性分析的easystats软件包...

  • 【RNA-Seq 实战】五、表达矩阵探索

    1 导入R 获取矩阵后正式开始下游分析。 2 绘图 相关性图 相关性热图 后续我们使用airway包的数据进行后续...

  • R语言-相关性检验及线性拟合

    相关性检验 相关性检验R=1时为完全正相关。R=-1为完全负相关。R=0为正态分布 斜率与R值无关 相关性检验co...

网友评论

      本文标题:R相关性分析

      本文链接:https://www.haomeiwen.com/subject/ealloltx.html