生信小课堂
本文的思路是通过单细胞数据分析识别了某种免疫细胞特有的marker基因,然后利用这些基因进行预后模型的构建。事实上,预后模型的文章已经不好发了,甚至有的审稿人看到预后模型就反感,因为实在是太多了,而且预测效能普遍不行。那么如何做的比这篇文章还要好呢?鉴于最近泛癌分析以及肿瘤分型分析比较好发,小编做的免疫细胞marker的泛癌分析以及肿瘤分型,内容是这些文章的2倍以上,均发表到8+杂志。所以我们在筛选到某种免疫细胞特有的marker基因后,可以对这些基因进行泛癌分析或者肿瘤分型分析。在分型分析中再附上简单的预后模型,但不以其为重点。这样的思路肯定是比本篇文章内容更多,更新颖。如果想做类似分析,欢迎交流。
研究背景:
肺癌是世界上最常见的恶性肿瘤之一,发病率和死亡率都很高。肺鳞癌(LUSC)是肺癌的主要组织学类型之一,约占所有肺癌病例的25% - 30%。近年来,免疫治疗已成为一种很有前途的癌症治疗策略,但只有少数LUSC患者能从免疫检查点抑制剂(immune checkpoint inhibitors, ICIs)治疗中获益。因此,寻找合适的生物标志物来预测LUSC的预后和治疗反应非常迫切。单细胞RNA测序(scRNA-seq)对于靶向治疗和免疫治疗的发展具有重要意义(14)。近年来,scRNA-seq揭示了TME中不同的免疫细胞亚群,为定义功能性生物标志物提供了一种新方法。鉴于这一优势,许多研究都专注于通过整合scRNA-seq和bulk RNA-seq数据来识别新的癌症生物标志物。
研究结果:
一、T细胞标记基因表达谱的鉴定
1、本研究中使用的scRNA-seq数据来自2个LUSC肿瘤样本的12950个细胞。图1A显示了检测到的基因数量范围、测序深度和每个样本中线粒体含量的百分比。
2、在对数据进行归一化处理后,选择了前2000个高变量基因(图1B)。
3、采用PCA方法降维(图1C), 15个p 值小于0.05的样本进行进一步分析(图1D)。
4、从9个聚类中共鉴定了1086个差异表达标记基因。各聚类中标记基因的相对表达量见热图(图1E)。
5、使用tSNE算法对9个聚类进行可视化(图1F)。
6、使用singleR算法来注释细胞亚群,发现簇2和簇4被定义为T细胞亚群(图1G)。
二、预后模型的构建与验证
1、 LASSO分析确定了基于最佳lambda值的8个T细胞marker基因和相应的系数(图2A, B)。
2、多变量Cox回归分析得到BTG1、JUND、IER3、ZNF331、PSAP 5个基因(图2C)。
3、根据中位TCMGrisk(中位TCMGrisk =0.973)将患者分为高危组和低危组。TCMGrisk的散点图显示,随着TCMGrisk评分的增加,OS降低,而死亡率上升(图2D-I)。
4、与低危组相比,高危组的生存期明显更长(P小于0.001)(图2J)。
5、1年、3年和5年训练队列的AUC分别为0.614、0.713和0.702(图2M)。
6、试验队列结果显示,低危组OS优于高危组OS (P=0.015)(图2K)。1、3、5年的AUC分别为0.669、0.603、0.645(图2N)。GEO队列结果显示,低危组OS优于高危组(P=0.030)(图2L)。1年、3年和5年的AUC分别为0.661、0.628和0.590(图2O)。
三、特征基因的差异表达
1、与正常患者相比,luc患者IER3表达上调,而JUND、PSAP和ZNF331表达下调。
2、利用HPA数据库的免疫组化结果进一步评估特征基因在LUSC中的表达。IER3蛋白显著高表达LUSC组织,抗体染色强,染色细胞多。而JUND和PSAP蛋白在正常组织中显著高表达。
四、诺姆图的建立与决策曲线分析
1、通过综合临床因素和TCMGrisk构建诺姆图,分别预测LUSC患者1、3、5年的生存概率(图3A)。
2、标定图显示,观测值与预测值高度一致(图3B)。
3、AUC结果显示nomogram在预测1、3、5年预后方面具有更高的临床净效益(图3C E), DCA显示nomogram在预测1、3年OS时具有最佳的临床净效益,而在预测5年OS时则没有(图3F-H)。
五、基因集合富集分析
1、高危组非小细胞肺癌通路富集(图4)。由于这些生物通路与免疫相关,并参与肿瘤免疫,进一步分析免疫,比较两组间的差异。
六、肿瘤免疫微环境和免疫相关基因的估计
1、免疫相关的高危组功能更活跃(图5A)。
2、相关分析显示,TCMGrisk与免疫评分、间质评分呈正相关(图5B、C)。
3、ESTIMATE算法结果显示,高危组间质评分、免疫评分、估计评分均显著高于高危组(P小于0.001)(图5D)。
4、ssGSEA算法结果发现高危组中T细胞CD4记忆静息、NK细胞激活、树突状细胞静息、中性粒细胞高表达(图5E)。
5、PD-L1、CTLA-4、IDO1、PDL2、TIM-3、LAG-3、TIGIT在高危组中呈高表达,而PD-1在两个高危组中表达差异无统计学意义(图5F)。
6、高危组HLA相关基因表达水平均较高(图5G)。
七、基因突变分析
1、LUSC的总体突变概况如图6A所示。
2、图6B显示了基因突变之间的相互作用,大多数基因之间的突变是同时发生的(P小于0.05)。
3、TP53、TTN和CSMD3是低危组和高危组中突变频率最高的基因(图6C、D)。
4、TMB表达水平在两危组间无差异(P=0.19)(图6E)。
5、K-M曲线显示,高TMB组的预后优于低TMB组(P小于0.001)(图6F)。
6、结合模型后,低危+高TMB组的预后明显好于高危+低TMB组(P小于0.001)(图6G)。
八、药物敏感性分析
1、进一步探讨低危组和高危组化疗药物IC50水平的差异(图7A-L)。TCMGrisk可作为抗癌药物选择的预测因子。
总结:免疫疗法已成为治疗癌症的一种强有力的临床策略。最近,随着ICIs的阳性结果,人们对肺癌的免疫治疗重新产生了兴趣。然而,探索能从免疫治疗中获益的LUSC患者仍然是一个巨大的挑战。目前的研究表明,scRNA-seq技术是探索肿瘤异质性和不同细胞亚群的强大工具,这对确定潜在的治疗靶点很重要。在本研究中,进行了scRNAseq分析,以探索LUSC中的T细胞标记基因,并使用训练队列构建预后特征。试验和GEO队列被用于进一步评估签名的预测能力。此外,本研究发现高危组的免疫评分、基质评分、免疫细胞浸润、免疫检查点和体细胞突变水平较高。在高危组中,更多的免疫相关通路也被富集。
网友评论