美文网首页TCGA data mining
利用R语言分析基因表达量和预后的关系

利用R语言分析基因表达量和预后的关系

作者: mayoneday | 来源:发表于2019-03-03 19:55 被阅读0次

分析基因表达量和预后的关系大体思路为:找出某一癌症中感兴趣的基因表达量和病人生存时间的数据,再进行生存分析,画图

分解起来看

第一步:得到基因表达量和病人生存时间相应的数据

方法一:利用网页工具,如:OncoLnc

OncoLnc: www.oncolnc.org
这个网站整合了TCGA的各种RNA数据和患者临床数据,提供生存分析

打开OncoLnc
输入感兴趣的基因 选择某一种癌症进行研究
把基因的表达量进行分组

生存分析最重要的就是分组

获得数据

方法二:TCGA数据库获取

待补充

第二步:把获得的数据用R语言读取后作图,且可以个性化调整

a=read.table('BRCA_6662_50_50.csv',
             sep = ',',
             header = TRUE,
             fill=T)#读取数据
library(ggstatsplot)
ggbetweenstats(dat, x=Group, y=Expression)
#加载R包后利用R包画图,该图以Group列数据为X轴,Expression列数据为Y轴
#此处有一个小技巧R包中的函数不用自己手打输入,根据说明书中的案列复制
Rplot.jpeg

注意表达量一般要log

画生存分析图

library(survival)
library(survminer)
table(dat$Status)
dat$Status=ifelse(dat$Status=="Dead",1,0)#把生存状态转换为数字0,1
sfit<-survfit(Surv(Days,Status)~Group,data=dat)
sfit
summary(sfit)
ggsurvplot(sfit,conf.int = F,pval = T)
得出生存分析图

小技巧:还可利用?ggsurvplot看说明书后按照具体细节调整图形

相关文章

网友评论

    本文标题:利用R语言分析基因表达量和预后的关系

    本文链接:https://www.haomeiwen.com/subject/ffhmuqtx.html