美文网首页
我暂时学不会生信,但我想快速查看TCGA数据,可以吗?Xena说

我暂时学不会生信,但我想快速查看TCGA数据,可以吗?Xena说

作者: 冻春卷 | 来源:发表于2023-02-20 13:08 被阅读0次

    好久没有更新文章啦~之前写了几篇Chip-seq相关的文档,在果子老师的公众号中发布了,近期得空的话应该也会同步到简书上吧。今天开一个新的文集,想介绍一下大名鼎鼎的Xena网页工具 (当然也可通通过GitHub下载他们的客户端工具哦~)。

    老实讲,作为一个专门做湿实验的人,即使我非常乐意学习生信,但这么多年过去。我的技术还是非常一般,仅仅是入门级别。得益于洲更的帮助,我才能顺利的推进一些项目的数据分析。最近我收到了一些需求,就是利用TCGA数据做一些分析。我呢一开始也是打开GDC,然后下载数据,打算使用R语言去处理并统计。但是这一套流程下来对于R语言功底非常薄弱的我来说,就非常耗费时间。我非常希望有一个在线工具能够快速的达成我的需求。因此我在搜索引擎上搜索,并找到了Xena。我打出这个名字,大概有一些人会说,这我早就知道呀,你怎么现在才知道?怎么在玩别人剩下的东西。我也只能笑笑,只要是非常好用的东西,还有人不知道,我就会非常想要推荐给大家,这大概就是按头安利吧!

    Xena homepage

    1. Xena是什么?

    Xena是加利福尼亚大学圣克鲁斯分校的研究团队主导开发,文章先于2019年9月上线预印本BioRxiv,并于2022年5月22日发表于NBT杂志的correspondence section:Goldman, M.J., Craft, B., Hastie, M. et al. Visualizing and interpreting cancer genomics data via the Xena platform. Nat Biotechnol (2020). https://doi.org/10.1038/s41587-020-0546-8。他们目前收录的数据库资源有:癌症基因组图谱(TCGA)、国际癌症基因组联盟(ICGC)和基因组数据共享(GDC)的数据

    database source

    Xena几乎支持任何功能基因组学数据,包括SNVs、INDELs、大结构变异、拷贝数变异、基因-、转录本-、外显子-、miRNA-、LncRNA-、蛋白质表达、DNA甲基化、ATAC-seq信号、表型/临床注释和更高水平的衍生基因组参数。除了可以查看它们收录的公共数据库数据,用户还可以使用该工具查看自己的个人数据

    基于对以上信息的了解,当下认定Xena是可以满足我要求的一个快速工具。确定目标后就要快速学习。

    2. 快速学习Xena使用方法

    和其他工具 一样,Xena有着非常完善的帮助文档系统,甚至还有一系列非常贴心的教学视频,因此个人认为,只要用户花费时间去学习帮助文档,就可无需他人帮助即可自行使用Xena。所以一开始我很犹豫要不要写一个这样的学习笔记,因我认为,我已经没有可以写的空间了,帮助文档已经非常完善。打开User Help Pages之后可以看到如下画面:

    User Help Pages

    首先看到左边一列书签/目录,我们看到帮助文档也分为好几个section,第一个是教程,里面包含基础教程1,2,3,以及高级教程1-2,同时还有Tumor和Normal对比的教程,以及如何使用Xena查看个人数据,以及一些经典的案例。

    我个人是花了一些时间把视频教程都看完了,虽然都是全英文的,但描述非常简洁明了,用词用句也尽量简单易懂,听起来不会费什么力气,我甚至认为这可当做一个非常好的学习初级英文讲课(演讲)的素材。这些视频教程大概有1个半小时左右,而我学习则花费了3-4个小时的时间,因为有时候会反复听,并且跟着视频操作,同时还会截图教程做PPT记录(实际上Xena的使用太过简单,学会之后再也没有回看过笔记了)。初步学习后就开始按照自己的需求操作,在操作过程中会回去再次查看教程。截止目前,我使用Xena的时间应该已经超过24小时,可以说基本入门Xena的使用方法,同时还有一些特别的内容随着我的需求,会进一步熟悉。

    3. Xena能干什么

    我们在介绍的时候就说过了,Xena可以查看转录组、拷贝数变异等等相关信息。与其说知道它能干什么,不如直接从我们的目的出发。肿瘤学研究有几个非常热门的需求,如下

    1. 查看某基因在某种癌中,癌和癌旁的表达差异,是否可以作为肿瘤的标记物?
    2. 查看某基因是否与生存or预后相关?此时需要进行生存曲线分析。
    3. 查看两个或者多个基因表达是否相关,且是否与生存相关,可否作为肿瘤的联合标记物?
    4. 比较一个基因或者多个基因在多种肿瘤类型中的表达或者突变情况:此时需要跨癌种进行表达分析,并且查看体细胞突变情况。
    5. 想知道基因表达是否与肿瘤亚型或者肿瘤进展(肿瘤分级或者转移与否)相关,是否可以作为预后标记物或者肿瘤某种亚型的标记物。

    以上都是非常经典的肿瘤学研究的需求,而这些需求通通可以使用Xena完成,且Xena都有相应的教程以供学习,此外,除了在Xena上完成分析,我们还可以直接下载我们在Xena上选好的数据,再使用R语言进一步分析。

    我怎么做...?

    4. 小结

    当人们有急切的需求时,从头学习生物信息学尤其是R语言,简直不要太痛苦。但随着生物信息学的快速发展,有非常多优秀的在线工具出现,使得零基础的人也有了触及数据分析的机会,有些在线工具可以一键完成转录组数据分析,一键画各种酷炫的图。虽然有些人觉得没啥意思,但我觉得对于外行人来说还是相当有意义的,当我们基本的需求得以快速的完成,那么不就有更多的时间用于思考了么?偶尔会听到有人说以后湿实验会被机器人取代,人类的工作会被AI抢掉,最近大火的ChatGPT强人工智能让这种论调再次甚嚣尘上。对于某个领域各种工具的快速发展我是持非常欢迎的态度,因为只有这样,人men才有更多时间去做人应该做的事情呀!最后,希望我们都能快乐学习!

    相关文章

      网友评论

          本文标题:我暂时学不会生信,但我想快速查看TCGA数据,可以吗?Xena说

          本文链接:https://www.haomeiwen.com/subject/ehxgkdtx.html