美文网首页GEO&TCGA数据库挖掘生信分析流程生信在线数据库
零代码下载TCGA数据库第二期:UCSC-XENA工具

零代码下载TCGA数据库第二期:UCSC-XENA工具

作者: 765f2ea50d22 | 来源:发表于2019-04-10 18:13 被阅读2次

    本文首发于 ”百味科研芝士“ 微信公众号,转载请注明:百味科研芝士,Focus科研人的百味需求

    点击蓝字关注我们

    各位科研芝士的朋友,大家好,今天我们继续分享关于TCGA数据下载的专题,第一节我们介绍了基于TCGA官网下载RNAseq数据。这次我们给大家推荐一个无编程的网页版工具,帮助我们轻松下载TCGA数据。今天,我们的主教就是UCSC-XENA工具。

    或许你早已听过他的大名,或许你初入TCGA的江湖,初闻该名,不过一切都不算晚,今天我们就轻轻的点击鼠标,实现我们的数据下载梦。

    01

    UCSC-XENA网址

    https://xena.ucsc.edu/

    人家的界面长这样:

    黄色框框是官网给的如何使用该网址的教程。

    红色框框是我们需要点击进入的界面。

    02

    点击launch Xena,出现下面的界面,那数据藏在哪里了呢?

    03

     点击DATA Sets 进入数据存储站,出现下面的界面

    可以看到在右侧的Active Data Hubs 包括了很多,不仅涵盖了TCGA还包括ICGA,Pan-Cancer Atlas Hub等数据节点。因为我们是研究TCGA,我们只需要选中TCGA就可以了。

    04

    选中TCGA,进入TCGA数据站,其包含的数据主要是下面38个

    05

    随便选择一个癌症,比如选择第一个AML,点击进去,出现下面的界面

    我们发现该网站已经整理好了各类数据,包括CNV,DNA甲基化等,方便用户下载,大大方便了我们使用。接着我们找到RNAseq数据,如下,注意有两个点,一个是exon expression RNAseq,一个是gene expression RNAseq,我们选择gene expression RNAseq,点击带有*号的数据,进入。

    06

    点击之后,进入下面的界面:

    点击红色框内的链接便可以进行数据下载了,下载之后的数据是一个压缩包,解压之后便可以使用了。

    07

    数据说明

    大家可以看到,他的单位是log2(count+1),说明这个网站是对count数进行了这种方式的处理来归一化的,不是FPKM哦,这个地方需要和大家说一下哈。

    Ok,今天的教程主要是带大家体验TCGA的第二种数据下载方式,下期我们继续推出TCGA的第三种方式下载,今天的数据下载先讲到这,下期再见。

    关注公众号,后台回复“生信资源”,获取200G生信资源包

    End

    相关文章

      网友评论

        本文标题:零代码下载TCGA数据库第二期:UCSC-XENA工具

        本文链接:https://www.haomeiwen.com/subject/lxvoiqtx.html