美文网首页ggplot集锦
基因表达矩阵和生存时间的合并

基因表达矩阵和生存时间的合并

作者: 米开朗巨魔 | 来源:发表于2020-04-03 13:03 被阅读0次

通常来说,GEO和TCGA的基因表达数据和临床数据是分开的,为了合并这两个数据,这里使用R进行操作。

基因表达数据如下:
基因表达文件.png
生存数据如下:
生存数据.png

在R中读入上述两个数据,然后使用代码合并。
代码如下:

# 生存时间和基因表达矩阵的合并
setwd("~/test_ty/survival/") # 这里你设置你自己的文件路径就可以了
options(stringsAsFactors = F)
rm(list = ls())

exp <- read.table("genematirx.txt",header = T,sep = "\t") #这里输入你的基因表达矩阵文件
time <- read.table("survivaltime.txt",header = T,sep = "\t") #这里输入你的生存时间文件
colnames(time)[1] <- colnames(exp)[1]

exp <- as.data.frame(t(exp)) 
colnames(exp)<- exp[1,] 
exp<- exp[-1,] 
result <- cbind(time,exp[match(time$ID,row.names(exp)),])
write.table(result,"combined.txt",sep = "\t",quote = F,row.names = F)

得到的combined.txt即合并后的文件。

相关文章

  • 基因表达矩阵和生存时间的合并

    通常来说,GEO和TCGA的基因表达数据和临床数据是分开的,为了合并这两个数据,这里使用R进行操作。 基因表达数据...

  • RNASeq

    htseq提取gene count 合并表达矩阵(合并count) 获得差异表达基因(DEGs) clusterp...

  • R语言中级作业

    主要内容 探针ID转换 表达矩阵处理 任意基因任意癌症表达量和临床形状的关联 任意基因任意癌症表达量分组的生存分析...

  • TCGA基因表达数据和生存数据合并

    打开临床数据excel,分别自定义排序futime和fustat,futime中去掉生存天数为0和没有的数据,fu...

  • DESeq差异分析

    基因表达矩阵,readcounts

  • 利用R语言分析基因表达量和预后的关系

    分析基因表达量和预后的关系大体思路为:找出某一癌症中感兴趣的基因表达量和病人生存时间的数据,再进行生存分析,画图 ...

  • 【r<-差异分析】当使用limma时,它在比较什么

    差异分析流程示例与资料 基因芯片的差异表达分析主要有 构建基因表达矩阵、构建实验设计矩阵、构建对比模型(对比矩阵)...

  • 合并表达矩阵

    在跑完htseq或者featureCounts之后会生成很多个如下的样本表达矩阵: 我们看一下每个样本有多少行: ...

  • 表达矩阵的合并

    刘小泽写于2018.8.20利用htseq-count、featureCounts等定量软件生成的counts计数...

  • DESeq2差异分析

    need:表达矩阵 分组矩阵,值要是整数 DESeq2和EdgeR都可用于做基因差异表达分析,主要也是用于RNA-...

网友评论

    本文标题:基因表达矩阵和生存时间的合并

    本文链接:https://www.haomeiwen.com/subject/rhdhphtx.html