不论是做基础研究还是临床研究,TCGA都是“宝藏”数据库,可是不会写代码,如何徒手挖掘TCGA?
来自北京大学的研究人员开发了GEPIA,GEPIA让没有任何编程背景的科研工作者能够轻松执行各种基因表达分析。其相关研究成果已发表在《Nucleic Acids Research》。
GEPIA(Gene Expression Profiling Interactive Analysis)web工具于2017年首次发布,基于TCGA和GTEx数据库中的肿瘤和正常样本进行基因表达分析。截至2019年5月,根据Google学术搜索的统计数据,GEPIA已被引用414次,并处理了来自全球约11万个不同IP地址的约40万个分析请求。
2019年研究团队推出了更高分辨率和更多功能的加强版GEPIA2。
如何使用GEPIA2?
GEPIA2为用户提供公共数据分析和自有数据分析两大块功能。
公共数据分析
用户可以使用GEPIA2的相关模块完成基于TCGA和GTEx数据的基因表达的一般性分析、差异表达分析、表达DIY、生存分析、Isoform分析、相关性分析、基因相似性分析、PCA分析。
基因表达的一般性分析
在输入框中输入目标基因名称,即可得到该基因在不同组织中正常和癌症中的表达交互人体图、散点图、柱状图以及异构体/相似基因列表。
基因表达的一般性分析示例
差异表达分析
设置搜索条件:选择癌症类型,筛选差异的阈值和差异表达的方法。点击plot可得到差异基因的不同染色体分布;点击list得到差异基因列表。
基因差异表达分析示例
表达DIY
1. 目的基因表达量分析
2. 特定基因的特定癌种的正常组织对比肿瘤组织的表达分析
3. 特定基因在特定癌种中的不同病理分期中的表达差异分析
4. 多个目标基因的表达分析
表达DIY分析示例
生存分析
对特定基因的生存分析
对特定病种里所有与预后差异显著相关的基因的汇总(适合找课题)
多个基因在多个癌症中与生存的关联分析
生存分析示例
Isoform分析
对同一个基因不同转录本的表达做分析,得到不同转录本的表达丰度及Isoform结构。
Isoform分析示例
基因相关性、相似性、PCA分析
输入基因或基因标签名称,选择癌种/样本信息,即可完成基因相关性、相似性、PCA分析。
基因相关性、相似性、PCA分析示例
自有数据分析
用户可上传自有数据,完成癌症亚型分类及基因表达分析。
自有数据分析示例
本地程序包
GEPIA2 提供了一个python程序包供快速分析和检索
首页功能分类模块
用户也可以在此模块选择相关分析功能(单基因分析、癌症类型分析、自有数据分析、多基因分析)。
Dataset Sources
提供了GEPIA2中可用的TCGA/GTEx数据的概述,包括组织样本、基因分类、Isoform和癌症亚型。
GEPIA2访问地址:http://gepia2.cancer-pku.cn/
首发公号:国家基因库大数据平台
参考文献
[1] Tang Z, Li C, Kang B, et al. GEPIA: a web server for cancer and normal gene expression profiling and interactive analyses[J]. Nucleic acids research, 2017, 45(W1): W98-W102.
[2] Tang Z, Kang B, Li C, et al. GEPIA2: an enhanced web server for large-scale expression profiling and interactive analysis[J]. Nucleic acids research, 2019, 47(W1): W556-W560.
图片来源于GEPIA2和参考文献,如有侵权请联系删除。
网友评论