单细胞数据结果提供了不同细胞类型之间的差异表达基因,这些基因参与的生物学通路决定了不同细胞类型的生物功能。因此,针对不同细胞类型的差异基因进行富集分析,可以更好的了解每种细胞类型参与的生物学功能,比较不同细胞类型信号通路差异,揭示和理解生物学过程中的关键分子机制。富集分析工具有GO、KEGG、Reactome、GSEA和GSVA等,其中GSEA和GSVA是单细胞文章中常见的富集分析工具。
一、单细胞富集分析常用方法
1. GSEA
GSEA富集分析使用的不是差异基因而是全部基因,更容易发现细微变化对生物通路的影响。GSEA富集分析需要预先进行样本之间的组间对比分析,通常用于Case/Control的实验设计,可以获取某个通路的基因集在实验组和对照组中的上调或下调趋势。单细胞GSEA富集分析可以对不同比较组之间相同的细胞类型进行分析,也可以对不同的细胞类型进行分析。
图1 GSEA富集分析结果2. GSVA
GSVA不需要预先对样本进行分组,可以计算每个样本或者细胞类型中特定基因集的富集分数,然后将富集分数在不同的样本或细胞类型间对比。单细胞数据的分组包含不同细胞类型,对照组和实验组,不同时间段的样本等,可以按照不同的分组将表达量矩阵和细胞分组信息提取出来,再进行后续分析 。
图2 GSVA富集分析结果(图片引自文献[1])二、单细胞富集分析应用思路
单细胞富集分析可以揭示细胞的发育机制、解析细胞异质性、探索组间细胞富集差异,从而挖掘疾病潜在的治疗靶点。
揭示细胞亚型的发育机制
在发育研究中,可以通过富集分析对亚型细胞进一步分析,阐述其分化机制。2019年中国人民解放军总医院等单位的研究人员在Immunity发表了利用单细胞测序研究人类早期T淋巴细胞生成和胸腺器官生成的文章。研究中通过对胸腺上皮细胞(TEC)的亚型TEC2群和TEC3群的细胞进行GSEA富集分析,发现BMP和WNT信号通路在TEC2和TEC3中分别显著富集。TEC3中代谢和抗原呈递相关基因的显著上调,表明TEC3比TEC2更成熟。揭示了胸腺上皮细胞的早期发育和成熟特征以及这些过程背后的分子特征。
图3 GSEA富集分析揭示胸腺上皮细胞亚型TEC2与TEC3的差异富集信号通路(图片引自文献[2])2. 探索肿瘤细胞异质性
在肿瘤研究中,可以通过富集分析探索不同肿瘤细胞亚群的异质性信息。2020年北京师范大学等单位的研究人员在Journal of Hepatology发表了利用单细胞测序研究肝内胆管癌肿瘤细胞异质性的文章。研究中对恶性细胞(亚群0-3)进行GSVA富集分析发现,亚群0富集上皮细胞-间充质转化信号,亚群1富集细胞周期和缺氧显性信号,亚群2富集干扰素应答信号。揭示了肿瘤细胞间高度的异质性。
图4 GSVA富集分析揭示肝内胆管癌肿瘤细胞异质性(图片引自文献[3])3. 区分肿瘤恶性细胞和非恶性细胞
在肿瘤研究中,可以通过富集分析区分肿瘤恶性细胞和非恶性细胞。2020年中国人民解放军总医院等单位的研究人员在Gut发表了利用单细胞测序研究胃化生细胞的起源和胃癌异质性的文章。研究中通过对恶性细胞和非恶性细胞进行GSEA富集分析发现,与非恶性上皮细胞相比,恶性上皮细胞富含肿瘤坏死因子、转录激活因子信号通路及其他对癌症的发展和进展至关重要的基因。揭示了胃癌发生潜在的分子机制。
图5 GSEA富集分析揭示胃癌恶性细胞与非恶性细胞的差异富集信号通路(图片引自文献[4])参考文献
1. He J, Yan J, Wang J, et al. Dissecting Human Embryonic Skeletal Stem Cell Ontogeny by Single-cell Transcriptomic and Functional Analyses[J]. Cell Research, 2021:1-16.
2. Zeng Y, Liu C, Gong Y, et al. Single-Cell RNA Sequencing Resolves Spatiotemporal Development of Pre-thymic Lymphoid Progenitors and Thymus Organogenesis in Human Embryos[J]. Immunity, 2019, 51(5):930-948.e6.
3. Zhang M, Yang H, Wan L, et al. Single-cell Transcriptomic Architecture and Intercellular Crosstalk of Human Intrahepatic Cholangiocarcinoma[J]. Journal of Hepatology, 2020, 73( 5):1118-1130.
4. Zhang M, Hu S, Min M, et al. Dissecting Transcriptional Heterogeneity in Primary Gastric Adenocarcinoma by Single Cell RNA Sequencing[J]. Gut, 2020, 70(3):gutjnl-2019-320368.
网友评论