美文网首页
相关性分析

相关性分析

作者: 一只小脑斧 | 来源:发表于2022-02-21 13:44 被阅读0次

################某基因与多基因间相关性 表达

rm(list = ls())

setwd("/data3/ff/data/xena_TCGA/TPM/gene.lnc")

#####读入表达文件                   

library(data.table)

PAAD<-fread("TCGA-PAAD.htseq-TPM.Gene.lnc.txt",data.table = F)

row.names(PAAD)<-PAAD$genenames

###########提取所需基因

gene<-read.table("/data3/ff/data/TF/AL5.TF.txt",header = T)

gene<-gene$TF

#####在表达文件中提取所需基因

expr<-PAAD[gene,]

#转置

expr<-t(expr)

expr<-as.data.frame(expr)

#删除第一行

expr<-expr[-1,]

#使用Hmisc 包,计算矩阵相关系数及其对应的显著性水平

library(Hmisc)

#写函数来提取矩阵相关及其P值

CorMatrix <- function(cor,p) {

                              ut <- upper.tri(cor)

                              data.frame(row = rownames(cor)[row(cor)[ut]] ,

                              column = rownames(cor)[col(cor)[ut]],

                              cor =(cor)[ut],

                              p = p[ut] )

}

res <- rcorr(as.matrix(expr), type=c("pearson"))

?rcorr #查看函数说明    rcorr(x, y, type=c("pearson","spearman"))

library(dplyr)

results <- CorMatrix (res$r, res$P) %>% as.data.frame() %>%

        filter(row == "AL5" & cor <0)

write_csv(results,"AL5.negative.TF.csv",col_names = T)

#####################两基因间相关性图

rm(list = ls())

setwd("/data3/ff/data/xena_TCGA/TPM/gene.lnc")

PAAD<-fread("TCGA-PAAD.htseq-TPM.Gene.lnc.txt",data.table = F)

row.names(PAAD)<-PAAD$genenames

PAAD<-PAAD[,-1]

##############################################################---LA.HE1相关性

LA.HE1<-PAAD[c("LA","HE1"),]

#转置

LA.HE1<-t(LA.HE1)

LA.HE1<-as.data.frame(LA.HE1)

#################################画图

library(ggplot2)

library(ggpmisc)

library(ggpubr)

#使用ggpubr包stat_cor,将相关系数和显著性水平加入

my.formula <- y ~ x

ggplot(data=LA.HE1,aes(x=LA,y=HE1)) +

  scale_x_log10() + scale_y_log10() +

  labs(title="TCGA PAAD", x="LA expression", y="HE1 expression")+

  theme_bw()+#移除背景

  theme(panel.grid.major=element_blank(),panel.grid.minor=element_blank())+#移除网格线

  theme(plot.title = element_text(hjust = 0.5))+ #设置标题居中

  geom_point(size=2,alpha=1,color="black") +

  #stat_poly_eq(formula = my.formula,

  #aes(label = paste(#..eq.label..,#展示方程

  #..rr.label..,#展示r值

  # sep = "~~~")),

  #parse = TRUE) +

  stat_cor(method = "pearson",#将相关系数和显著性水平加入

          #label.x =-2, label.y = -2,

          color='black',p.accuracy = 0.001)+

  geom_smooth(method="lm",color="red",alpha=.7,size=1.2,se=FALSE, formula = my.formula)+

  scale_y_continuous(breaks = c(0,1,2,3,4,5,6,7,8,9,10))+

  scale_x_continuous(breaks = c(0,1,2,3,4,5,6,7,8,9,10));

ggsave("LA.HE1.cor.pdf",width = 10, height =8,dpi = 300)  #保存成pdf

相关文章

网友评论

      本文标题:相关性分析

      本文链接:https://www.haomeiwen.com/subject/igfilrtx.html