本文首发于 ”百味科研芝士“ 微信公众号,转载请注明:百味科研芝士,Focus科研人的百味需求
点击蓝字关注我们
各位科研芝士的朋友,大家好,又见面了,TCGA的下载我们已经连续分享了3个帖子,分别是官网直接下载,UCSC-XENA下载和cBioportal工具下载,你以为数据下载就结束了吗?不是哦,今天我们继续分享关于TCGA数据无编程下载。我们继续秉承一个点点鼠标下载的理念,给大家推荐好用的TCGA下载工具。
那今天,我们的主题就是Fire Browse工具。
Fire Browse(http://firebrowse.org/),这是由 Broad研究所开发的用于TCGA数据挖掘可视化的网络平台,提供基因表达,突变等综合挖掘分析功能,类似于cBioportal。该网站在TCGA数据可视化中做的依旧不错,可以帮助大家更好使用TCGA这个资源丰富的数据库。毕竟所有资源的开发都是为了进一步对数据进行整合。下面我们就进入正题,网站主页是这样的:
接着我们还要提一下另外一个和Fire Browse非常相近的FireHouse,这个和Firebrowse的关系,就是Fire Browse是FireHouse的浏览器,FireHouse是数据的存储站。
那我们就先来认识一下FireHouse,我们主要关注Software和Download
先点击software,界面如下:
我们发现其提供了基于python和R的数据处理方式,比如我们点开python,如下:
这个需要我们安装python环境下的firehouse库。
接着我们点击R环境,如下:
它就要求我们安装FirebrowseR这个包,后续关于该包的使用,我们会继续推出教程,欢迎大家继续关注。
接着我们点击download,发现它提供了一个数据下载工具firehose_get工具,支持数据下载,并且提供了详细的软件使用说明。
既然我们是关于鼠标点击数据下载的,怎么能用软件这么复杂的操作呢?那我们,如何通过鼠标点击实现下载的梦想呢?首先我们进入FireHouse主界面,如下:
点击第一个Data 下面的Browse,便进入肾上腺皮质癌的数据展示界面,会出现下面的界面。
看到了FireBrowse是不是有一种莫名的熟悉感?红色框框内部便是我们看到的for ACC,ACC是对肾上腺皮质癌的简写。
点击mRNAseq
我们看到了有上述5类数据:
illuminahiseq_rnaseqv2-RSEM_isoforms_normalized (MD5)
基于RSEM的软件基因的isoforms的归一化之后的表达数据
illuminahiseq_rnaseqv2-exon_quantification (MD5)
基于RSEM的软件外显子定量的表达数据
illuminahiseq_rnaseqv2-RSEM_genes (MD5)
基于RSEM的软件基因的表达数据
illuminahiseq_rnaseqv2-RSEM_genes_normalized (MD5)
基于RSEM的软件基因的归一化之后的表达数据
mRNAseq_Preprocess (MD5)
基于RSEM的软件处理过程
illuminahiseq_rnaseqv2-RSEM_isoforms (MD5)
基于RSEM的软件的isoforms的定量数据
illuminahiseq_rnaseqv2-junction_quantification (MD5)
基于RSEM的软件融合基因定量数据
RNAseq数据下载我们主要关注两个文件,分别是illuminahiseq_rnaseqv2-RSEM_genes (MD5),
illuminahiseq_rnaseqv2-RSEM_genes_normalized (MD5)
分别用Excel打开如下:
illuminahiseq_rnaseqv2-RSEM_genes (MD5)
我们可以看到,该文件里面包含了raw count文件。
illuminahiseq_rnaseqv2-RSEM_genes_normalized (MD5)
我们可以看到,该文件里面包含了归一化之后的count文件。
数据下载好之后,我们点击Analysis。
如下:
可以看到最显著的明显的突变基因列表。
除此之外,我们还可以ACC的CNL的信息,如下:
OK,今天的教程主要是带大家体验TCGA的第四种非编程数据下载方式,下期我们继续推出TCGA的基于R语言数据下载的方式,今天的数据下载先讲到这。
关注公众号,后台回复“生信资源”,获取200G生信资源包
End
网友评论