美文网首页
思路较简单的单细胞结合bulk数据建模分析,适合新手学习!

思路较简单的单细胞结合bulk数据建模分析,适合新手学习!

作者: 生信小课堂 | 来源:发表于2024-07-04 22:34 被阅读0次

影响因子:7.7

研究概述:肺癌可分为非小细胞肺癌和小细胞肺癌,其中非小细胞肺癌包括多种亚型,而肺腺癌(LUAD)是最常见的亚型,占所有诊断病例的约40%。肺癌的病因极为复杂,近年来,基因靶向治疗和免疫疗法已广泛用于临床治疗,能在一定程度上改善患者的生存时间和生活质量。然而,肺癌的预后依然严峻,五年生存率仅约15%,探索LUAD细胞中基因表达调控机制,并寻找有效的诊断标志物,以提高早期诊断率是极为重要的。肿瘤微环境(TME)是一个极其多样的环境,癌细胞与免疫细胞、基质细胞及其他细胞类型相互作用。TME的基质成分与肿瘤细胞相互作用,影响肿瘤的生长、转移和药物耐受性。因此,理解肿瘤细胞与微环境中基质成分的相互作用在LUAD的发生和发展过程中是至关重要的。为了进一步研究LUAD中的基因调控网络和细胞亚型,这篇文章作者整合了LUAD相关的单细胞和转录组数据,识别关键致病基因,并细化LUAD的单细胞图谱,为LUAD的靶向治疗策略的制定提供了更精准的指导。具体流程如下:

研究结果:

LUAD的单细胞和转录组综合分析

为了找到LUAD的关键细胞亚群和致病基因,作者收集了10个LUAD样本和10个正常样本绘制了LUAD图谱(共聚类了114,019个细胞, 21个细胞簇)包括上皮细胞、基质细胞(成纤维细胞和内皮细胞)以及免疫细胞(CD8+ T细胞、单核细胞、巨噬细胞、B细胞和肥大细胞)(图a)。这些细胞类型的标记marker,如上皮细胞的EPCAM和KRT19,内皮细胞的PECAM1和VWF都显示了强烈的特异性表达(图b)。作者还发现在样本水平上存在不同细胞的比例分布(图c)。与对照样本相比,LUAD样本中CD8+ T细胞、上皮细胞和B细胞的数量显著增加,而单核细胞、巨噬细胞、内皮细胞和肥大细胞的数量显著减少(图c)。为了进一步反映LUAD在单细胞水平上的异质性,作者用三种方法(Divergence,DEsingle,SigEMD都是为分析单细胞测序数据中的差异表达而开发技术)识别出1726个差异基因DEGs(图d),这些基因主要与细胞外基质、免疫反应和生长因子通路相关,可能促进淋巴细胞的发育、成熟、凋亡和免疫反应(图2e)。并且,这些通路的DEGs在基质细胞中表现出高水平表达(图2f)。


基质细胞的通路富集分析和调控网络构建

尽管前面的单细胞图谱显示基质细胞在LUAD中只占小部分,但既往文献表明它们在TME中发挥着关键作用。于是作者探索基质细胞相对于上皮细胞和免疫细胞的差异表达基,确定了255个上调基因和113个下调基因(图a)。KEGG富集分析显示上调的DEGs主要富集在与局部粘附、ECM-受体相互作用、补体和凝血级联相关的通路中,涉及信号转导通路和分子相互作用,这些对维持组织结构、免疫反应、细胞粘附和细胞信号传导至关重要(图b)。最后,作者使用CellChat和NicheNet算法来构建配体-受体-转录因子和靶基因调控网络(图c)。调控网络的前两层由来自上皮细胞和免疫细胞的配体和受体组成,随后影响基质细胞。其中VEGFA在血管调控中起核心作用。VEGFA及其受体FLT1、KDR和NRP2可以促进肿瘤血管的生长和增殖。此外,OSM(成肌素:在免疫系统、炎症、细胞存活和分化等一系列生物过程中起重要作用)通过其靶向受体IL6ST、LIFR和OSMR发挥作用。总的来说,调控网络有16种配体作用于29种转录因子(Transcription factors,TF),共同调控基质细胞中的53个基因,构成了TME的复杂景观。


建立基于关键生物标志物的预后模型

作者通过将上文的调控网络中靶基因与DEGs取交集,获得了40个基因。进一步整合了TCGA-LUAD的转录组数据,这些数据包括LUAD和对照样本的基因表达数据。其中25个基因在TCGA数据集中具有差异表达。为了在这25个基因中识别出关键致病基因,作者采用了LASSO回归来构建出一个包括10个基因的模型(图a)。这些基因在TCGA肿瘤患者中高表达(图b)。其中有七个基因(CAV2, COL1A1, TIMP1, ETS2, AKAP12, ID1和COL1A2)的单变量Cox回归分析P值小于0.05,表明它们与LUAD有强关联。随后,作者便挑选249个TCGA-LUAD患者训练了一个预后模型,并从七个预后基因的表达水平中得出了风险评分。通过对包括性别、年龄、T、N和分期在内的五个LUAD临床特征以及风险评分进行多变量COX回归分析,结果表明LUAD患者的总体生存率OS与风险评分之间具有强关联(p < 0.001, HR = 2.73, 95% CI = 1.86-4.0,图c)。为了验证模型的稳健性,使用了其余的97个TCGA-LUAD患者预测生存结果。KM生存曲线显示在训练集(P = 0.004,图d)和验证集(P < 0.0001,图e)中,高风险组患者的OS均显著较差。LUAD患者一年、三年和五年生存预测模型评分的ROC曲线下面积分别为0.87、0.77和0.74,表明模型性能优异(图f)。



基质细胞亚型的细胞特异性转录因子

作者从单细胞样本中提取了4516个基质细胞进行后续的聚类和注释,其中包括2950个正常细胞和1566个LUAD细胞(图a)。细化以后,基质细胞被分为12个簇,根据文献中的标记基因注释为8个细胞亚型,以及一个高表达CCL5和NKG7但未被定义细胞亚型(图b)。为了评估这8个细胞亚型的TFs细胞特异性,作者检查了上文调控网络中29个TFs在9个细胞亚型中的基因表达。结果表明,这29个TFs主要集中在间皮细胞、血管ECs和基质CAFs中,而在其他细胞亚型中的表达水平较低(图c)。具体来说,RELA、FOXO1、CREB1、HLF、ETS1、KLF2和STAT5B在血管ECs中表现出特异且高水平的表达。RELA、ETS1和KLF2在对照和肿瘤样本之间的表达也存在显著差异,并且这些基因已被报道与肿瘤发生有关。而在基质CAFs中,高表达的转录因子基因包括E2F1、TP53和FOS。


基质细胞亚型的拟时序分析

为了探索基质细胞亚群在细胞分化发育过程中与预后基因的关系,作者使对九种基质细胞亚型的分化轨迹进行了分析。具有五个不同状态的基质细胞被分化为两个分支(图a)。成纤维细胞相关的细胞亚型主要分布在状态1和2,位于细胞分化轨迹的早期阶段。内皮细胞相关的细胞主要分布在状态4和5。状态3代表成纤维细胞和内皮细胞之间的中间分化阶段,细胞数量相对较少。 作为成纤维细胞亚型的基质CAFs和间皮细胞在分化时间上表现出差异。基质CAFs倾向于更早且集中地分化,而间皮细胞的分化时间较晚,可能仍处于分化过程中。EPCs主要位于状态4,而血管内皮细胞则位于分化轨迹的最终阶段(图6b)。在血管形成过程中,初始的血管网络通过EPCs的分化、扩展和合并建立起来。预后基因在时间轨迹分布上的差异在LUAD治疗中也起着关键作用。CAV2、ETS2和ID1主要集中在血管内皮细胞簇中,表明它们参与了细胞分化的晚期阶段。COL1A1和COL1A2在分化早期阶段显著表达。它们分别编码胶原Iα1和Iα2链,是成纤维细胞的主要成分,对结缔组织的形成、维护和修复起关键作用。AKAP12的表达水平在分化前期的中期阶段相对稳定,但在分化的最终阶段,特别是与血管内皮细胞簇相关时显著增加。与其他基因不同,TIMP1在分化中期阶段高度表达(图c)。


研究总结:

这篇文章探讨了LUAD中基质细胞相关基因的预后影响,并通过单细胞RNA测序和癌症基因组图谱的数据整合,揭示了基质细胞在肿瘤微环境中的调控机制。作者首先识别出7个与LUAD相关的关键致病基因,这些基因在基质细胞亚型中显示出特异性调控,并与患者的生存预后密切相关。构建的预后模型显示,高表达这些基因的患者生存预后较差。随后,基质细胞被分为9个亚型,在不同基质细胞亚型中,特定转录因子(如RELA、FOXO1、ETS1等)表现出高水平的表达。 最后作者利用拟时序分析模拟了基质细胞亚型在细胞分化和发育过程中的轨迹。总的来说,作者通过综合单细胞RNA测序和TCGA数据,揭示了LUAD中基质细胞的调控机制,这些研究结果为LUAD的早期诊断和靶向治疗提供了新的思路。

相关文章

网友评论

      本文标题:思路较简单的单细胞结合bulk数据建模分析,适合新手学习!

      本文链接:https://www.haomeiwen.com/subject/tjdicjtx.html