美文网首页
7.7分纯生信,单细胞常规分析+建模,思路经典,分析不难,相信你

7.7分纯生信,单细胞常规分析+建模,思路经典,分析不难,相信你

作者: 生信小课堂 | 来源:发表于2023-09-27 12:49 被阅读0次

    大家好!今天给大家介绍一篇关于胃癌(GC)诊断和预后特征的生信文章。文章中建立了GC的单细胞转录图谱,重点关注T细胞相关基因的表达,用于细胞-细胞通讯分析、轨迹分析和转录因子调控网络分析。发现了与T细胞相关的预后特征。根据这些预后特征将患者分为高风险或低风险组,可以有效地预测患者的生存率和肿瘤微环境的免疫浸润状态。文章思路简单,方法不难可重复,感兴趣的小伙伴不要错过哦!

    摘要

    **背景 **胃癌( gastric cancer,GC )的早期诊断和预后预测是当前GC治疗临床实践中面临的重大挑战。因此,作者的目的是探索可以预测GC患者预后的相关基因特征。

    方法 在本研究中,作者建立了GC的单细胞转录图谱,重点关注T细胞相关基因的表达,用于细胞-细胞通讯分析、轨迹分析和转录因子调控网络分析。此外,作者使用TCGA和GEO数据对胃癌患者的免疫相关预后基因特征进行了验证和预测。基于这些预后基因标签,作者通过将患者样本分为高风险或低风险组来预测GC患者的免疫浸润状态。

    结果 基于10例胃癌患者的肿瘤样本和相应的正常样本,作者选取了18416个细胞进行后续的单细胞测序分析。从中,作者鉴定了3284个T细胞,并从5种不同的T细胞亚型中获得了641个与T细胞相关的差异表达基因。通过整合大量RNA测序数据,作者发现了与T细胞相关的预后特征。根据这些预后特征将患者分为高风险或低风险组,可以有效地预测患者的生存率和肿瘤微环境的免疫浸润状态。

    结论 本研究探索了胃癌患者中与T细胞相关的预后基因特征,为预测患者的生存率和免疫浸润水平提供了见解。

    图 1 研究工作流程

    研究结果

    胃癌的单细胞转录组图谱

    在本研究中,作者共分析了GSE183904数据集中的10个样本,其中包括5例患者的肿瘤和正常组织样本。每个样本都进行了初步筛选,以去除低质量数据,结果保留了18416个细胞用于后续分析。然后,作者整合不同的样本以消除批次效应,并进行标准化、中心化和PCA降尺度,然后使用t - SNE方法进行聚类可视化。图2A展示了不同样本的单细胞转录组图谱,而图2B展示了正常和肿瘤样本的单细胞转录组图谱。聚类分析将18416个细胞分为25个簇,如图2C所示。使用Single R包进行细胞注释发现8种细胞类型( 图2D ):高表达PGC的上皮细胞、高表达XCL1的NK细胞、高表达C1Q8的巨噬细胞、高表达IL7R的T细胞、高表达IGLC2的B细胞、高表达POSTN的组织干细胞、高表达HLA - DRA的单核细胞和高表达PLVAP (图2F和G)的内皮细胞。图2E为其在不同样本中的比例,上皮细胞、T细胞、B细胞和NK细胞所占比例较高,而组织干细胞、巨噬细胞、单核细胞和内皮细胞所占比例相对较小。

    图 2 GC患者正常和肿瘤样本的单细胞图谱综述。

    scRNA-seq中T细胞的单细胞转录组图谱和富集分析

    GC scRNA-seq图谱显示在所有样本中都存在大量的T细胞。因此,本研究从样本中提取3284个T细胞,用于后续的聚类和标注。图3A显示了T细胞再次聚类后的7个簇,图3B显示了T细胞的注释,包括763个记忆CD8 T细胞,426个黏膜相关不变型T ( MAIT )细胞,297个调节性T细胞,1017个T辅助细胞1/17 (Th 1/17)和781个Vδ2 T细胞。图3C和D为每个T细胞亚型的标记基因,包括GZMK、CCR6、trbv1 -1、LINC01871和BATF,图3E为每个T细胞亚型的前10个DEGs。对T细胞相关的DEGs进行GO富集分析,发现它们主要富集在BP,如免疫系统过程的调节、免疫反应和细胞活化(图3F及附表S5)等。在细胞组分( CC )方面,主要集中在细胞表面、膜的一侧和质膜的外侧。在分子功能( molecular function,MF )方面,它们主要参与信号受体结合、抗原结合和免疫球蛋白受体结合。KEGG富集分析显示,T细胞相关标志基因主要参与细胞因子-细胞因子受体相互作用、MAPK信号通路和NF - κ B信号通路(图3G)。


    图 3 scRNA-seq中T细胞的单细胞转录组图谱。

    细胞-细胞通讯分析

    在这项研究中,作者采用CellChat功能来模拟不同类型细胞之间的配体-受体相互作用,从而产生细胞-细胞通信网络(图4A)。通过对该网络信号通路的通路分析,作者发现了在细胞间通讯中频繁出现的中期因子(MK)和巨噬细胞移动抑制因子(MIF)信号通路。发现MIF信号传导途径广泛存在于各种类型细胞中的配体-受体相互作用中,其中CD74、CXR4和CD44在多种细胞类型中表现出更高的表达水平(图4B-G)。


    图 4 细胞间通讯分析。

    scRNA-seq中T细胞的伪时序分析

    伪时序分析,又称细胞轨迹分析,是根据单细胞样本中时间基因的表达模式,模拟不同细胞的发育轨迹。在本研究中,作者提取T细胞来展示它们的发育轨迹,揭示了T细胞亚型的四个分支(图5A)。图5B和D表明T细胞在发育过程中表现出9种分化状态,而图5C和E描述了细胞亚型分化的时间顺序,颜色较深的细胞逐渐过渡到颜色较浅的细胞。这说明调节性T细胞和辅助性T细胞属于细胞发育的早期阶段,而记忆性CD8 T细胞则属于细胞分化的晚期阶段,从第4分支到第2分支,再到第3分支,最后到第1分支。随后,作者利用BEAM函数,通过热图展示了这四个不同分支的时间基因表达。通过GO富集分析探索BPs,结果表明,分支1主要与蛋白结合、适应性免疫反应、T细胞激活的正向调节、白细胞激活的调节有关。分支2主要与适应性免疫反应、对外界刺激反应的正调控、对病毒的反应有关。分支3主要与适应性免疫反应、炎症反应和细胞死亡的正调控有关。最后,分支4主要与免疫球蛋白产生、T细胞分化和对趋化因子(图5F – I )的反应有关。可见,这些BPs主要参与T细胞分化和免疫应答。



    图 5 scRNA-seq中T细胞的伪时间分析。

    T细胞中TF调控网络的构建

    利用SCENIC功能预测TFs及其与T细胞相关的靶基因。最终选取前5个TFs (SPI1、TFF3、FOXP3、MYLK、GATA2)进行分析(图6A)。随后,采用Cytoscape软件进行网络可视化,将TFs表示为绿色节点,对应的靶基因表示为黄色节点(图6B)。对这些靶基因进行富集分析,氧化石墨烯分析结果显示,在信号转导、炎症反应和免疫反应等bp中显著富集(图6C)。KEGG分析结果显示,在肿瘤通路、细胞因子-细胞因子受体相互作用、PI3K-Akt信号通路、MAPK信号通路等通路中显著富集(图6D)。



    图 6 T细胞中TF调控网络的分析。

    T细胞中预后基因签名的预测和验证

    在TCGA-STAD数据集上进行差异基因分析,将得到的1494个DEGs与scRNA-seq中的641个T细胞相关DEGs取交集,得到10个交集基因(图7A ):MAL、HOPX、ARL4D、GKN1、HBB、CLIC3、GPR15、HPGD、MZB1和GBP5。首先,对这些基因的表达矩阵进行标准化,并采用LASSO回归分析计算其风险分数。以TCGA-STAD数据集为训练集,GSE84437数据集为测试集,建立预后模型。根据风险评分(图7B-D , G)将患者分为高危组和低危组。Kaplan-Meier生存曲线显示训练集和测试集(图7E, H)的高风险组预后均较差。时间依赖的ROC曲线分析显示,在训练集( GC患者1年、3年和5年生存率的AUC约为0.6)和测试集(图7F, I)中,预后特征在预测患者总生存期方面具有良好的性能。随后,生成气泡图来可视化scRNA-seq中10个预后信号的表达(图8A)。此外,我们还分析了这10个预后信号与22种免疫细胞类型之间的相关性,发现GBP5与多种T细胞亚型之间存在很强的相关性(图8B)。


    图 7 T细胞中预后基因签名的预测和验证。


    图 8 T细胞和免疫细胞预后信号的相关性分析。

    临床相关性cox回归分析及诺图图分析

    为了进一步阐明与胃癌相关的危险因素,并验证现有预后基因标签的风险评分,我们对患者的临床信息进行了Cox回归分析。在单因素Cox回归分析中,发现年龄( HR = 1.019 , 95 % CI = 1.001 ~ 1.037 , P < 0.05)、性别( HR = 1.482 , 95 % CI = 1.012 ~ 2.172 , P < 0.05)、肿瘤分期( HR = 1.559 , 95 % CI = 1.255 ~ 1.936 , P < 0.001)和风险评分( HR = 1.947 , 95 % CI = 1.323 ~ 2.866 , P < 0.001)显著影响患者的总生存期,并被确定为不良预后危险因素(图9A )。在多因素Cox回归分析中,年龄( HR = 1.031 , 95 % CI = 1.013 ~ 1.050 , P < 0.001)、肿瘤分期( HR = 1.678 , 95 % CI = 1.338 ~ 2.105 , P < 0.001)和风险评分( HR = 2.326 , 95 % CI = 1.540 ~ 3.512 , P < 0.001)被确定为影响患者总生存期的独立预后因素(图9B )。随后,利用GC患者的临床数据,我们用R语言生成了列线图。该列线图对患者的年龄、性别、肿瘤T、N、M分期及危险度评分提供了相应的分值,可以预测1年、3年、5年的生存概率(图9C)。

    图 9 临床风险指标分析。

    预后基因签名的免疫浸润分析

    为了进一步探讨高危组和低风险患者组的预后信号与TME之间的关系,我们首先使用CIBERSORT算法对22种免疫细胞类型的比例进行了可视化分析(图10A)。随后,在风险分层的基础上,利用ESTIMATE算法计算患者的免疫评分。结果显示,高危组基质评分较高(P < 0.0001),而低风险组免疫评分较高(P < 0.001)(图10B-E)。此外,我们使用ssGSEA算法来分析高危和低风险患者群体的免疫细胞比例。分析表明,低危组中CD8 T细胞、活化记忆CD4 T细胞、T滤泡辅助细胞、γδ T细胞和M1巨噬细胞的比例较高。相反,高危组表现出更高比例的静息记忆性CD4 T细胞、单核细胞、静息肥大细胞和幼稚B细胞(图10F )。这些发现表明,与高风险组相比,低风险组患者具有抗肿瘤活性的免疫细胞比例更高,表明免疫浸润在肿瘤发生发展过程中的主要作用。


    图 10 T细胞预后基因特征的免疫浸润分析

    结论

    在本研究中,作者利用scRNA-seq方法构建胃癌单细胞转录组图谱,探索T细胞在细胞轨迹、转录因子调控网络和细胞-细胞通讯机制中的作用。此外,作者将单细胞样本与TCGA和GEO数据整合,以预测和验证与T细胞相关的预后基因特征,使作者能够预测患者1年、3年和5年生存率。此外,作者观察到这些预后基因特征也具有预测TME内免疫浸润的能力。

    相关文章

      网友评论

          本文标题:7.7分纯生信,单细胞常规分析+建模,思路经典,分析不难,相信你

          本文链接:https://www.haomeiwen.com/subject/sgskbdtx.html