美文网首页生信在线数据库GEO&TCGA数据库挖掘R语言做生信
零代码下载TCGA数据库第四期:Fire Browse工具

零代码下载TCGA数据库第四期:Fire Browse工具

作者: 765f2ea50d22 | 来源:发表于2019-04-15 10:13 被阅读1次

    本文首发于 ”百味科研芝士“ 微信公众号,转载请注明:百味科研芝士,Focus科研人的百味需求

    点击蓝字关注我们

    各位科研芝士的朋友,大家好,又见面了,TCGA的下载我们已经连续分享了3个帖子,分别是官网直接下载,UCSC-XENA下载和cBioportal工具下载,你以为数据下载就结束了吗?不是哦,今天我们继续分享关于TCGA数据无编程下载。我们继续秉承一个点点鼠标下载的理念,给大家推荐好用的TCGA下载工具。

    那今天,我们的主题就是Fire Browse工具

    Fire Browse(http://firebrowse.org/),这是由 Broad研究所开发的用于TCGA数据挖掘可视化的网络平台,提供基因表达,突变等综合挖掘分析功能,类似于cBioportal。该网站在TCGA数据可视化中做的依旧不错,可以帮助大家更好使用TCGA这个资源丰富的数据库。毕竟所有资源的开发都是为了进一步对数据进行整合。下面我们就进入正题,网站主页是这样的:

    接着我们还要提一下另外一个和Fire Browse非常相近的FireHouse,这个和Firebrowse的关系,就是Fire Browse是FireHouse的浏览器,FireHouse是数据的存储站。

    那我们就先来认识一下FireHouse,我们主要关注Software和Download

    先点击software,界面如下:

    我们发现其提供了基于python和R的数据处理方式,比如我们点开python,如下:

    这个需要我们安装python环境下的firehouse库。

    接着我们点击R环境,如下:

    它就要求我们安装FirebrowseR这个包,后续关于该包的使用,我们会继续推出教程,欢迎大家继续关注。

    接着我们点击download,发现它提供了一个数据下载工具firehose_get工具,支持数据下载,并且提供了详细的软件使用说明。

    既然我们是关于鼠标点击数据下载的,怎么能用软件这么复杂的操作呢?那我们,如何通过鼠标点击实现下载的梦想呢?首先我们进入FireHouse主界面,如下:

    点击第一个Data 下面的Browse,便进入肾上腺皮质癌的数据展示界面,会出现下面的界面。

    看到了FireBrowse是不是有一种莫名的熟悉感?红色框框内部便是我们看到的for ACC,ACC是对肾上腺皮质癌的简写。

    点击mRNAseq

    我们看到了有上述5类数据:

    illuminahiseq_rnaseqv2-RSEM_isoforms_normalized  (MD5)
    基于RSEM的软件基因的isoforms的归一化之后的表达数据


    illuminahiseq_rnaseqv2-exon_quantification  (MD5)
    基于RSEM的软件外显子定量的表达数据


    illuminahiseq_rnaseqv2-RSEM_genes  (MD5)
    基于RSEM的软件基因的表达数据


    illuminahiseq_rnaseqv2-RSEM_genes_normalized  (MD5)
    基于RSEM的软件基因的归一化之后的表达数据


    mRNAseq_Preprocess  (MD5)
    基于RSEM的软件处理过程


    illuminahiseq_rnaseqv2-RSEM_isoforms  (MD5)
    基于RSEM的软件的isoforms的定量数据


    illuminahiseq_rnaseqv2-junction_quantification  (MD5)
    基于RSEM的软件融合基因定量数据

    RNAseq数据下载我们主要关注两个文件,分别是illuminahiseq_rnaseqv2-RSEM_genes  (MD5),

    illuminahiseq_rnaseqv2-RSEM_genes_normalized  (MD5)

    分别用Excel打开如下:

    illuminahiseq_rnaseqv2-RSEM_genes  (MD5)

    我们可以看到,该文件里面包含了raw count文件。

    illuminahiseq_rnaseqv2-RSEM_genes_normalized  (MD5)

    我们可以看到,该文件里面包含了归一化之后的count文件。 

    数据下载好之后,我们点击Analysis。

    如下:

    可以看到最显著的明显的突变基因列表。

    除此之外,我们还可以ACC的CNL的信息,如下:

    OK,今天的教程主要是带大家体验TCGA的第四种非编程数据下载方式,下期我们继续推出TCGA的基于R语言数据下载的方式,今天的数据下载先讲到这。

    关注公众号,后台回复“生信资源”,获取200G生信资源包

    End

    相关文章

      网友评论

        本文标题:零代码下载TCGA数据库第四期:Fire Browse工具

        本文链接:https://www.haomeiwen.com/subject/ngbywqtx.html