ssGSEA

作者: 一只烟酒僧 | 来源:发表于2020-10-27 17:05 被阅读0次

ssGSEA算法原理及应用TCGA数据
ssGSEA
ssGSEA
Xcell实战
免疫浸润--xCell使用简介
文章套路01|ssGSEA+免疫浸润
ssGSEA分析
CIBERSORT 免疫浸润
ssGSEA 与CIBERSORT分析--肿瘤免疫浸润分析
思路清奇SCI:05.ssGSEA+41条代谢通路

参考连接：https://shengxin.ren/article/403
ssGSEA顾名思义是一种特殊的GSEA，它主要针对单样本无法做GSEA而提出的一种实现方法，原理上与GSEA是类似的，不同的是GSEA需要准备表达谱文件即gct，根据表达谱文件计算每个基因的rank值，再进行后续的统计分析。

而单个样本则无法计算rank，当然GSEA也支持你直接提供rank来进行富集分析的，这个不在此讨论，我们这里主要介绍ssGSEA用来对单个样本做GSEA富集分析的原理。

关于R的实现可以参考：https://support.bioconductor.org/p/98463/

关于genepattern工具在这里：http://software.broadinstitute.org/cancer/software/genepattern/modules/docs/ssGSEAProjection/4

首先假设我们有一个样本的表达数据，那么他应该是这样的

第一列为基因，第二列为表达值，这样的两列的数据矩阵

首先我们对我们的样本的所有基因的表达水平进行排序获得其在所有基因中的秩次rank，这些基因的集合为BG

假设我们要对其进行KEGG的分析，首先我们需要在GSEA官网找到KEGG对应的gmt文件

gmt文件主要格式是：每行表示一个通路，第一列为通路ID,第二列为通路对应的描述，第三列开始到最后一列为该通路中的基因

那么对于任意的一个通路A,我们可以拿到这个通路的基因列表GL

我们从GL中寻找BG里存在的基因并计数为NC,并将这些基因的表达水平加和为SG

开始计算ES：

对于任意一个表达谱中的基因 G: