找完标志后的后续分析
Webgestalt
在组学数据分析中,基因富集分析是最常用的方法之一,所有的基因数据分析最终都要落实到功能上去,富集分析作为一种最基础的功能研究方法,通过go, kegg pathway等不同的基因功能注释数据库,再结合对应的富集分析算法,可以探究输入的基因富集在哪些功能上。
富集分析的必要性和重要性不言而喻,有很多的成熟的软件可以来进行这样的分析,比如clusterProfiler, GSEA等等,然而这些工具的使用还是具备一定的门槛,对于没有编程经验的生物学家而言通过这些软件得到富集分析的结果并不是一件容易的事情。
为了方便广大科研工作者进行富集分析,有很多的在线工具被开发出来,其操作简便,更易上手,最著名的当属DAVID这个网站了,有接近4000次的引用。然而该网站数据更新并不及时,在现在看来,其数据库版本过于老旧,而且不支持一些新出的功能注释数据库。
webgestalt是一个专注于富集分析的在线网站,支持多种富集分析算法,而且涵盖的功能注释数据库较为全面,在今年5月份刚刚升级了版本,对数据库进行了更新。
支持12个物种,324种基因ID格式,功能注释不仅包括了常见的go,kegg, 还涵盖了蛋白质相互作用,miRNA靶基因,疾病注释,药物靶点等各种注释信息。支持3种富集分析算法:
可参考以下两个网页
https://www.yisu.com/zixun/572936.html
https://zhuanlan.zhihu.com/p/132663560
Metascape
Metascape集成了四十多个生物信息数据库,通过一键快速分析的简洁界面让生物学者能够轻松获得全面的数据解析。 其不仅在内容上包含了生物通路富集分析,蛋白质互作用网络结构分析以及丰富的基因注释功能,而且将结果以生物学家容易理解的高质量的图表语言加以呈现。与其他工具相比,Metascape克服了常见的难以学习使用,数据库缺乏更新,和结果不易理解的缺陷。
Metascape能自动识别常用的各种基因或蛋白质的标识符。分析完成后网页会引导用户打开一份分析报告。分析报告模仿科研论文的格式来展现分析结果,图文并茂,对生物学者极其友好。报告中详细阐述了分析方法和图形的意义,而且图形都含可以发表的高清晰文件格式。报告还提供了格式化好的Excel文件,许多文章直接使用它做supplementary table。自动生成的PowerPoint文件方便学者们交流结果。
当代的多组学实验往往生成多个基因列表,目前的网络工具很少能同时分析并整合多基因列表,而这恰恰是Metascape的长处之一。其实Metascape的”meta”就是来源于多列表的meta-analysis。图3以三组过去独立发表的流感宿主因子列表为例进行说明。
如何操作参考以下网址:
http://www.sci666.net/2270.html
https://cloud.tencent.com/developer/news/96301
DisGeNET(metascape富集分析结果涉及到的一个数据库)数据库介绍如下网址:
https://www.jianshu.com/p/21244a67e3d1
Oncomine:肿瘤芯片数据库介绍参考以下网址
https://www.jianshu.com/p/ccd5d9fc80b2
Cosmic数据库介绍参考以下网址
https://cloud.tencent.com/developer/article/1626267
网友评论