本文首发于 ”百味科研芝士“ 微信公众号,转载请注明:百味科研芝士,Focus科研人的百味需求
点击蓝字关注我们
各位科研芝士的朋友,大家好,今天我们继续分享关于TCGA数据下载的专题,第一节我们介绍了基于TCGA官网下载RNAseq数据。这次我们给大家推荐一个无编程的网页版工具,帮助我们轻松下载TCGA数据。今天,我们的主教就是UCSC-XENA工具。
或许你早已听过他的大名,或许你初入TCGA的江湖,初闻该名,不过一切都不算晚,今天我们就轻轻的点击鼠标,实现我们的数据下载梦。
01UCSC-XENA网址
https://xena.ucsc.edu/
人家的界面长这样:
黄色框框是官网给的如何使用该网址的教程。
红色框框是我们需要点击进入的界面。
02点击launch Xena,出现下面的界面,那数据藏在哪里了呢?
03点击DATA Sets 进入数据存储站,出现下面的界面
可以看到在右侧的Active Data Hubs 包括了很多,不仅涵盖了TCGA还包括ICGA,Pan-Cancer Atlas Hub等数据节点。因为我们是研究TCGA,我们只需要选中TCGA就可以了。
04选中TCGA,进入TCGA数据站,其包含的数据主要是下面38个
05随便选择一个癌症,比如选择第一个AML,点击进去,出现下面的界面
我们发现该网站已经整理好了各类数据,包括CNV,DNA甲基化等,方便用户下载,大大方便了我们使用。接着我们找到RNAseq数据,如下,注意有两个点,一个是exon expression RNAseq,一个是gene expression RNAseq,我们选择gene expression RNAseq,点击带有*号的数据,进入。
06点击之后,进入下面的界面:
点击红色框内的链接便可以进行数据下载了,下载之后的数据是一个压缩包,解压之后便可以使用了。
07数据说明
大家可以看到,他的单位是log2(count+1),说明这个网站是对count数进行了这种方式的处理来归一化的,不是FPKM哦,这个地方需要和大家说一下哈。
Ok,今天的教程主要是带大家体验TCGA的第二种数据下载方式,下期我们继续推出TCGA的第三种方式下载,今天的数据下载先讲到这,下期再见。
关注公众号,后台回复“生信资源”,获取200G生信资源包
End
网友评论