昨天给大家简单的介绍了一下富集分析的常见的词语都是什么意思,但是具体要怎么实现基因的富集分析呢。今天就给大家推荐这个软件把: WebSestalt(http://www.webgestalt.org)
PS:如果会R语言,当然还是首推clusterprofiler的。毕竟业界公认的好呀。
WebSestalt简介
WebSestalt全称为WEB-based Gene SeT AnaLysis Toolkit。翻译过来也就是说基于网页的基因集的分析工具。由于基于网页嘛,所以就会很简单的入手。从这个数据库的更新来看,这个数据库有13,17,19版本。所以还是在一定更新的。结果的质量而言还是有一定保证的。这样对于不会编程的人而言,也是可以很容易上手的。
根据我们之前接受的三种富集分析的算法而言。这个数据库也同样基于三种算法分成了三个功能。

数据输入
数据的使用主要包括两个方面,一个就是基本的参数,我们要选择对什么物种做什么分析。另外就是输入符合要求的格式即可。
1. 基本参数
数据库的基本参数包括:

1.1 选择物种
这个数据库支持包括人和老鼠在内的十多种物种。当如如果没有的话,也可以自己上传物种的数据集来构建自己的小物种数据。

1.2 选择分析方式
之前接受的三种富集分析方式都可以进行选择。我们可以基于自己想要的分析方式来进行选择。

1.3 选择背景数据库
这里我们需要选择背景数据库。除了常见的GO和Pathway。还包括疾病、药物等其他的背景数据集。
由于我们经常想要做很多方面的富集分析,网站很贴心的也有了一个添加背景数据集的按钮。我们通过 + 也就可以添加额外的数据了。

2. 输入想要分析的基因集
对于不同的基因分析方式需要输入的基因集不同,其中 ORA和 NTA需要输入的都是候选的基因名即可。而 GSEA 则需要输入全基因所有基因的名和相对于的变化倍数。

数据结果
GSEA分析的结果都包括两个方面:一个是整体数据的总结,另外一个就是具体结果的可视化。
1. ORA结果

2. GSEA结果
2.1 总体数据汇总
网站提供了三种总体数据汇总的方式: 表格; 柱状图以及 火山图
2.2 具体某一个结果的详细信息
如果我们想要查看具体的某一个通路或者什么的具体信息。那就可以在下面输入相对应的通路号即可。
3. NTA结果
网络分析的结果,主要是通过亚网络的格式展示的。这个我们可以看到具体的信息同时也可以看到网络中基因的富集结果。
数据下载
对于任何的分析结果。我们都是可以通过结果界面的结果下载来下载结果的
网友评论