美文网首页R语言做图bioinformaticsR plot
R语言maftools包画oncoplot(瀑布图)的一个简单小

R语言maftools包画oncoplot(瀑布图)的一个简单小

作者: 小明的数据分析笔记本 | 来源:发表于2021-04-05 20:47 被阅读0次

    几天在一个讨论群里看见有人 问是 否可以有偿做TCGA中 某个肿瘤的突变基因瀑布图吗,瀑布图之前听过,但是自己没有画过。感觉有错过了一个可以赚外快的好机会,赶紧找资料来学习一下,争取下次可以抓住赚外快的好机会,哈哈哈哈。

    搜索了一下,有现成的包可以做这个事情,链接 http://bioconductor.org/packages/devel/bioc/vignettes/maftools/inst/doc/oncoplots.html 一行代码就出图,这也太方便了吧!

    image.png

    看来画图不难,难点应该在于如何按照指定的格式准备数据。

    首先把代码运行一下,看自己能不能得到结果图

    之前没有用过这个包,第一次用需要先安装
    BiocManager::install("maftools")
    

    安装没有遇到问题

    加载
    library(maftools)
    
    获得输入文件的路径
    laml.maf = system.file('extdata', 
                           'tcga_laml.maf.gz', 
                           package = 'maftools')
    laml.maf
    laml.clin = system.file('extdata', 
                            'tcga_laml_annot.tsv',
                            package = 'maftools')
    laml.clin
    
    image.png
    读入数据
    laml = read.maf(maf = laml.maf,
                    clinicalData = laml.clin,
                    verbose = FALSE)
    class(laml)
    laml@
    
    image.png

    读进来的数据有好多内容,暂时还搞不懂是啥

    接下来是画图
    oncoplot(maf = laml, draw_titv = TRUE)
    
    image.png
    接下来看看输入数据的格式

    临床数据是一个tsv文件,数据相对比较简单, (tsv文件就是文件内部的内容使用指标付分隔)

    image.png

    另外一个文件是 一个压缩文件 ,解压出来也是一个tsv格式的文件

    image.png

    那么如何把TCGA格式的数据整理成上面的格式呢?后面学到了再来记录吧!

    TCGA和GEO数据库挖掘也该学起来了!

    欢迎大家关注我的公众号
    小明的数据分析笔记本

    小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!

    相关文章

      网友评论

        本文标题:R语言maftools包画oncoplot(瀑布图)的一个简单小

        本文链接:https://www.haomeiwen.com/subject/gttjkltx.html