美文网首页
TCGAbiolinks更新了,轻松下载TCGA改版后的转录组数

TCGAbiolinks更新了,轻松下载TCGA改版后的转录组数

作者: SCI狂人团队 | 来源:发表于2022-05-02 10:14 被阅读0次

    前一段时间TCGA数据库改了版,TCGAbiolinks包原来的代码没有办法获取相关的mRNA和lncRNA数据,但是TCGAbiolinks包的作者很给力,很快就将TCGAbiolinks包进行了更新,所以需要重新安装TCGAbiolinks:

    if (!requireNamespace("BiocManager", quietly = TRUE))

      install.packages("BiocManager")

    BiocManager::install("remotes")

    BiocManager::install("BioinformaticsFMRP/TCGAbiolinksGUI.data")

    BiocManager::install("BioinformaticsFMRP/TCGAbiolinks")

    BiocManager::install("SummarizedExperiment")

    安装好这些包后,需要对代码进行一些修改,例如workflow.type这里需要改为workflow.type="STAR - Counts"使用assay函数获取表达矩阵的时候需要设计参数i,也就是选择你要下载的数据格式:

    geneexp <- assay(mydata,i = "unstranded")#tpm_unstrand fpkm_unstrand

    例如你要下载Counts格式就需要i= "unstranded",下载tpm格就要i="tpm_unstrand",下载fpkm格式就要i=" fpkm_unstrand"。

    TCGA改版后最大的好处就是不需要转换id了,可以直接获取具有基因名字的表达矩阵,同时可以直接提取出mRNA矩阵和lncRNA矩阵,可以节省不少时间和精力。

    write.table(mRNA,"mRNA.txt",quote = F,sep = "\t",row.names = F)

    write.table(lncRNA,"lncRNA.txt",quote = F,sep = "\t",row.names = F)

    这样就可以轻松一步到位获取TCGA数据库的mRNA矩阵和lncRNA矩阵,比使用perl方便多了,不需要安装多余的软件,全程使用R语言。

    相关文章

      网友评论

          本文标题:TCGAbiolinks更新了,轻松下载TCGA改版后的转录组数

          本文链接:https://www.haomeiwen.com/subject/tqwmyrtx.html