GSEA软件使用方法简介

GSEA软件使用方法简介

作者: 生信修炼手册 | 来源:发表于2018-11-20 15:54 被阅读21次

GSEA软件使用方法简介
GSEA的分析汇总-转载
用clusterProfiler做GSEA
GSEA富集分析流程及解释（R代码）【待完善】
GSEA的分析汇总
GSEA分析
GSEA基因富集分析实战
使用log2FC排序的基因集进行GSEA分析
Day3 conda学习笔记——曹婕
安装GSEA

欢迎关注”生信修炼手册”!

Gene Set Enrichment Analysis是一种富集算法，由Broad Institute研究所的科学家提出，算法核心示意如下

需要两个输入元素，一个就是排序好的基因列表，这里的排序的规则是展现两组间的差异，比如按照Foldchange的值进行排序，第二个就是基因的注释集合，然后运行KS检验计算Enrichment Score(ES),用置换检验评估ES的可靠性。

Broad Institute研究所的科学家同时还提供对应的分析软件GSEA，该软件是java语言开发的图形界面软件，简单易用，下载地址如下

http://software.broadinstitute.org/gsea/downloads.jsp

官网提供了多种下载方式，推荐直接下载jar文件，示意图如下

如下所示，运行GSEA分析，需要两个基本元素，第一个就是表达谱数据，可以是芯片数据，也可以是rna-seq的定量结果，第二个就是基因集数据库，官网对于human提供了MSigDB数据库，当然你也可以自己定义基因集。

在实际操作时，第一步首先是导入数据，有以下4种数据需要导入，由于在windows平台操作，通过特定的后缀来识别文件格式

1. expression datasets

表达量文件，可以是芯片，也可以是rna-seq的定量结果，后缀为gct, 示意如下

该文件是\t分隔的纯文本文件，第一行内容总是为#1.2, 表示版本，第二行表示表达量矩阵的维度，第一个值对应探针探针/基因个数，第二个数值代表样本个数，第三行是表达量矩阵的表头，前两列固定是NAME和Description, NAME是基因ID或者探针ID,必须保证唯一，Description表示描述信息，如果没有，可以用na填充，后面每列对应一个样本。

2. phenotype labels

样本的分组文件，后缀为cls, 示意如下

第一行为空格或者\t分隔的3个数值，第一个数值表示样本总数，第二个数值表示样本对应的分组数目，第三个数值总是1。

第二行以#开头，指定不同分组的名字；第三行的每个字段代表一个样本，顺序和表达量文件中的样本顺序一致，只不过将样本名用对应的分组名字表示。

3. gene sets

基因集文件，有多种格式，常用的有gmt和gmx, gmt示意如下

每一行代表一个基因集合，第一列为基因集合的名字，必须唯一，第二列为描述信息，如果没有就用na填充，后面的列为该集合下的基因，每列之间用\t分隔。gmt格式示意如下

和gmt相反，gmt中每一列代表一个基因集合，第一行为基因集合的名字，必须唯一，第二行为描述信息，如果没有就用na填充，其他行为该集合下的基因。

4. chip annotation

当提供了芯片数据时，可以导入chip类型的文件，该文件保存的是探针和基因之间的对应关系，后缀为chip, 示意如下

第一列为探针ID, 表头为Probe_Set_ID,第二列为探针对应的基因，表头为Gene Symbol, 第三列为探针描述信息，没有就用na填充。

通过Load Data，首先将以上几种文件导入软件中，然后点击Run GSEA菜单，选择对应的各种文件

phenotype labels用于指定组间比较的顺序，明确哪一组作为control组。

上文中提到，GSEA需要两个输入元素，排序好的基因列表和基因集合，当导入表达量数据和分组信息后，GSEA会自动计算分组将的差异值，然后根据这个差异值对基因进行排序，支持的统计量有以下几种，其中

1. signal2noise

2. t-Test

3. ratio_of_class

4. diff_of_class

5. log2_ratio_of_class

默认的算法为signal2noise, 可以在Basic fields中进行调整，这个参数可以在``示意如下

当所有参数都设置好之后，点击下方的Run按钮即可运行。

·end·

—如果喜欢，快分享给你的朋友们吧—

扫描关注微信号，更多精彩内容等着你！

相关文章

GSEA软件使用方法简介
欢迎关注”生信修炼手册”! Gene Set Enrichment Analysis是一种富集算法，由Broad ...
GSEA的分析汇总-转载
GSEA的分析汇总学习GSEA 生信技能树 GSEA的统计学原理试讲 GSEA GSEA这个java软件使用非常...
用clusterProfiler做GSEA
GSEA的介绍：https://www.omicsclass.com/article/230GSEA有相应的软件，...
GSEA富集分析流程及解释（R代码）【待完善】
GSEA简介 GSEA法基因功能富集分析原理详解[https://www.plob.org/article/162...
GSEA的分析汇总
GSEA的统计学原理试讲 GSEA GSEA这个java软件使用非常方便，只需要根据要求做好GCT/CLS格式的i...
GSEA分析
GSEA是非常常见的富集分析方式，以前我们做GSEA需要用依赖java的GSEA软件，那个时候准备分析的文件可能要...
GSEA基因富集分析实战
GSEA在很多文献中都有使用到，可以使用R分析，也可以使用GSEA软件进行分析，个人觉得用软件分析出来的图好看些，...
使用log2FC排序的基因集进行GSEA分析
目前做GSEA主要有两种办法，一种是使用GSEA的java软件，另一种是使用R语言包，当时还有在线的工具做GSEA...
Day3 conda学习笔记——曹婕
内容主要包括生物信息学软件管理工具conda的简介和使用方法
安装GSEA
参考文章Window安装基因集富集分析软件GSEA | Public Library of Bioinformat...

网友评论

本文标题：GSEA软件使用方法简介

本文链接：https://www.haomeiwen.com/subject/wsdxqqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

生信必备生物知识

转录组数据分析

热点阅读

RNA-seq

生信必备生物知识

转录组数据分析

关于我们|服务条款|联系我们|GSEA软件使用方法简介|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！