美文网首页
TCGA基因表达数据和生存数据合并

TCGA基因表达数据和生存数据合并

作者: 萍智医信 | 来源:发表于2021-08-11 19:39 被阅读0次

    打开临床数据excel,分别自定义排序futime和fustat,futime中去掉生存天数为0和没有的数据,fustat中去掉无生存状态的数据(1为死亡,0为存活)


    临床数据整理最终结果.png

    将上图数据全部复制粘贴到新建time.txt文件中


    time.txt.png
    输入文件lncrnaPair.txt.png
    library(limma)                #引用包
    pairFile="lncrnaPair.txt"     #免疫lncRNA对文件
    cliFile="time.txt"            #生存数据文件
    setwd("E:\\Master research")    #设置工作目录
    
    #读取表达文件,并对输入文件整理
    rt=read.table(pairFile, header=T, sep="\t", check.names=F)
    rt=as.matrix(rt)
    rownames(rt)=rt[,1]
    exp=rt[,2:ncol(rt)]
    dimnames=list(rownames(exp), colnames(exp))
    data=matrix(as.numeric(as.matrix(exp)), nrow=nrow(exp), dimnames=dimnames)
    data=avereps(data)
    
    #删掉正常样品
    group=sapply(strsplit(colnames(data),"\\-"),"[",4)
    group=sapply(strsplit(group,""),"[",1)
    group=gsub("2","1",group)
    data=data[,group==0]
    colnames(data)=gsub("(.*?)\\-(.*?)\\-(.*?)\\-(.*?)\\-.*", "\\1\\-\\2\\-\\3", colnames(data))
    data=t(data)
    data=avereps(data)
    
    #读取生存数据
    cli=read.table(cliFile,sep="\t",check.names=F,header=T,row.names=1)     #读取临床文件
    
    #数据合并并输出结果
    sameSample=intersect(row.names(data),row.names(cli))
    data=data[sameSample,]
    cli=cli[sameSample,]
    out=cbind(cli,data)
    out=cbind(id=row.names(out),out)
    write.table(out,file="pairTime.txt",sep="\t",row.names=F,quote=F)
    
    输出文件.png

    相关文章

      网友评论

          本文标题:TCGA基因表达数据和生存数据合并

          本文链接:https://www.haomeiwen.com/subject/jpctbltx.html