Mitophagy-Related Gene Signature for Prediction Prognosis, Immune Scenery, Mutation, and Chemotherapy Response in Pancreatic Cancer
预测胰腺癌预后、免疫状况、突变和化疗反应的线粒体自噬相关的基因特征
发表期刊:Front Cell Dev Biol
发表日期:2022 Feb 7
DOI: 10.3389/fcell.2021.802528
一、背景
胰腺癌(PC)是一种毁灭性的消化道恶性肿瘤,占癌症相关死亡的4.7%,据说到2025年可能成为癌症死亡的第三大原因。高异质性、难以早期诊断和有限的疗效是PC的不利预后的原因。
线粒体自噬是一种保守的细胞过程,通过选择性去除功能失调的线粒体在维持细胞稳态方面发挥着至关重要的作用。 尽管越来越多的证据表明线粒体自噬与胰腺肿瘤发生有关,但线粒体自噬相关基因对胰腺癌 (PC) 预后和治疗反应的影响仍然很大程度上未知。
由于PC患者中复杂的分子亚型和肿瘤异质性,大多数基因表达变异的特征仍然很差,抑制了它们的临床转化。因此,迫切需要一种新的生物标志物用于预后分层和治疗目的,以增强PC患者的预后结果。一些研究人员建议,免疫评分可以作为基于传统TNM分期系统的癌症分期系统的一部分以进一步改善总体预后的评估。免疫评分系统的引入将进一步有助于为PC分层和预后预测提供新的见解。
二、材料与方法
1.数据来源
(1)TCGA数据库并作为训练集:来自TCGA-胰腺癌(TCGA-PAAD)的176个样本数据(FPKM)
(2)验证队列从ICGC数据库和GEO数据库下载:自ICGC-胰腺癌-澳大利亚(ICGC-PACA-AU)的79个样本,来自GSE28735的41个样本,来自GSE62452的62个样本
(3)PC患者的免疫评分来自ESTIMATE数据库
(4)从Pathway Unification数据库下载了29个与线粒体自噬相关的基因(MRGs)
2.分析流程
(1)差异表达基因(DEGs)的筛选:根据免疫评分的中位数,将TCGA队列的PC样本分为高免疫组和低免疫组;在假发现率阈值(FDR)<0.05的情况下,在两个免疫组之间确定显著的DEGs;网络构建
(2)基于线粒体自噬相关的基因(MRGs)的肿瘤分类:使用R软件包"ConsensusClusterPlus "进行一致性分析;生存分析
(3)构建和验证与线粒体自噬有关的基因特征:单变量Cox回归分析、多变量Cox回归分析、最小绝对收缩和选择算子(LASSO)算法
(4)特征基因的分析:特征基因的生存分析是用R包 "survive "进行的,特征基因的表达在人类蛋白质图谱(HPA)数据库中得到验证;TIMER数据库评估了免疫浸润细胞的丰度与特征基因之间的相关性
(5)nomogram的建立:从TCGA队列中提取临床特征,然后进行单变量和多变量Cox回归分析,以确定独立的预后因素。基于多变量分析的结果,我们应用R包“rms”来创建用于指导临床决策的列线图。使用C指数,校准曲线和AUC来评估列线图的预测准确性。
(6)功能富集分析:通过GO和KEGG对两个风险组|log2FC|≥1和FDR <0.05d的DEGs的功能进行了注释;采用单样本基因集富集分析(ssGSEA)计算免疫浸润细胞的得分和通路的活性
(7)肿瘤免疫细胞浸润的评估:R软件包 "ggstatsplot "对风险评分和六种免疫浸润细胞(B细胞、CD4+T细胞、CD8+T细胞、中性粒细胞、巨噬细胞和骨髓树突状细胞)的表达进行了Spearman相关分析;CIBERSORT
(8)免疫检查点分析:使用R包“ggplot2”和“reshape2”测定了两个风险亚组中8个免疫检查点基因的表达水平。
(9)突变状态分析:使用R包“maftools”来分析两个风险亚组之间的突变状态。
(10)药物易感性分析:将预测特征放入GDSC进行训练;预测过程使用R软件包 "pRRophetic "进行;化疗药物的IC50值估计是通过岭回归进行
三、实验结果
1.两个免疫亚群DEGs的鉴定
根据免疫评分的中位数,PC样本被分为两个免疫亚组。七个MRG在高免疫组和低免疫组之间有差异表达(图1A,B)。其中,三个基因(自噬相关5(ATG5),微管相关蛋白1轻链三β(MAP1LC3B),Parkin RBR E3泛素蛋白连接酶(PRKN))在高免疫组下调,而另外四个基因上调(SRC,线粒体外膜20的易位酶(TOMM20),线粒体外膜40的易位酶(TOMM40),电压依赖阴离子通道1(VDAC1))。图1C显示了DEGs的相关网络,不同颜色反映不同的相关系数。此外,还构建了PPI网络以确定这些线粒体自噬相关DEGs的相互作用,PPI网络分析的结果表明,TOMM20是一个枢纽基因(图1D)。
图1 TCGA队列中两个免疫亚群之间的线粒体自噬相关的差异表达基因(DEGs)2.基于MRG的肿瘤分类
进行共识聚类分析以评估MRGs对PC样本的影响。根据累积分布函数(CDF)曲线的结果和CDF曲线下面积的相对变化,如图2A,B所示,K=3被确定为最佳聚类数,它对应于在CDF曲线下的区域中引起最小增量变化的最大聚类数,同时保持聚类内的最大共识。图2C的结果显示,来自TCGA队列的PC患者样本可以基于线粒体自噬相关基因(MRGs)分为三个亚型(N = 124,48,6),三个亚型之间的生存率有明显差异(图2D)。三个亚型之间的基因表达谱见图2E。
图2 基于线粒体自噬相关基因的肿瘤分类3.三种MRGs特征的建立与验证
经过单变量的Cox回归分析,三个MRG被确定为TCGA队列中的预后相关基因。SRC和VDAC1是风险基因,而PRKN是保护基因(图3A)。LASSO回归进一步缩小了候选基因的范围,最终建立了一个3个基因的特征(图3B,C)。多变量Cox回归进一步筛选了预后相关的基因,PRKN被认为是一个独立的预后基因(图3D)。风险评分的计算方法如下:
Risk score=(−0.929609894)∗PRKN+0.006652335∗SRC+0.001093884∗VDAC1。
图3 TCGA队列中线粒体自噬相关基因特征的鉴定根据风险评分的中位数,PC样本被分为高风险组(n = 88)和低风险组(n = 88),风险评分较高的患者与更高的死亡风险和较短的生存时间有关(图3E,F)。PCA显示高风险组和低风险组之间有明显的区别(图3G)。生存曲线表明,高危患者的生存期比低危患者更差(图3H)。在TCGA队列中,三年和五年的生存AUC值分别为0.785和0.782(图3I)。外部验证集显示了3个基因特征的较高的预测准确性。图4A,B,F,G,J,K显示了队列中PC样本的风险分数分布和他们的生存状况。与TCGA队列的结果一致,在三个队列中,高危患者的生存率明显低于低危患者(图4L)。此外,三个验证队列的AUC值对3年后的生存率表现出良好的预测能力和稳健性(图4E、I、M),表明3个基因特征可以可靠地预测PC患者的生存。
图4 验证集队列中线粒体自噬相关基因特征的鉴定4.3-特征基因与生存和免疫活动有关
为了评估三个特征基因的预后能力和免疫相关性,作者评估了它们在TCGA队列和人类免疫组化组织中的表达水平,同时对这些基因进行了生存和免疫相关性的分析。图5A显示了三个特征基因的表达以及风险评分与TCGA队列的临床特征(年龄、性别、酒精、等级、阶段、TNM和生存状态)之间的相关性,与低风险组相比,高风险组中PRKN的表达水平较低,而SRC和VDAC1的表达较高。对这三个特征基因的生存分析也显示它们与预后密切相关(图5B-D)。此外,特征基因的表达在HPA数据库的肿瘤样本和正常样本中得到了验证。如图5E-G所示,PRKN在PC组织中低表达,而SRC和VDAC1在PC组织中高表达,与基因表达分析的结果一致。接下来,作者进一步分析了这三个特征基因与免疫之间的关系,发现PRKN与六种免疫细胞(B细胞、巨噬细胞、骨髓树突状细胞、中性粒细胞、CD4+T细胞和CD8+T细胞)密切相关(图5H)。从TIMER数据库中提取的结果显示,PRKN与这六种免疫浸润细胞呈正相关(图5I)。
图5 3个特征基因的分析5. 预后模型与临床特征的相关性
为了评估重要的预后因素和预后模型的临床适用性,作者进行了单变量和多变量分析以确定独立的预后因素,并绘制了nomogram。从TCGA队列中提取了PC患者的临床信息,包括年龄、性别、酒精、等级、阶段、T-stage和N-stage。经过单因素和多因素的Cox回归分析,年龄、N-stage和风险评分被确定为独立的预后因素(图6A)。基于独立预后因素构建预测列线图以预测PC病例的1年、3年、5年生存率(图6B)。校准图显示预测和实际结果之间有很好的一致性(图6C-E)。预测1年、3年、5年生存率的提名图的AUC分别为0.647、0.870和1.00(图6F-H)。
图6 确定独立的预后因素并构建预测性列线图6. 3-基因特征的功能富集
为了进一步探索3基因特征的功能富集,作者对高危和低风险组之间的差异基因进行了GO富集,KEGG分析和免疫富集评分。在TCGA队列的两组之间共筛选了2128个DEG。GO富集结果表明,这些DEGs主要富集在膜电位和信号释放方面(图7A)。KEGG分析显示神经活性配体-受体相互作用和细胞因子-细胞因子受体相互作用有明显富集(图7B)。预后模型的进一步功能分析表明,3基因特征与免疫活性显著相关。高危组大多数免疫细胞浸润细胞显著低于低危组(图 7C)。与低危组相比,高危组免疫途径的富集评分(如CCR、检查点、细胞溶解活性、HLA、炎症促进、T细胞共抑制、T细胞共刺激、II型IFN反应)显著降低(图 7D)。
图7 TCGA队列中3基因特征的功能分析7.3-基因特征与免疫微环境和免疫检查点有关
为了进一步探讨3-基因特征与免疫微环境之间的差异,作者对风险分数和免疫分数进行了spearman关联。如图8A-F所示,风险评分与六种免疫浸润细胞(B细胞、CD4+T细胞、CD8+T细胞、中性粒细胞、巨噬细胞和骨髓树突状细胞)呈负相关。图8G显示了TCGA队列的PC患者中22种免疫细胞的比例。巨噬细胞M0、巨噬细胞M2和静息记忆CD4+T细胞所占比例最高。图8H显示了22种肿瘤免疫细胞在高风险和低风险患者之间的分布。具体来说,大多数免疫细胞、浸润细胞在两个风险亚组之间有显著差异,表明3基因特征和免疫微环境之间有很强的相关性(图8I)。此外,作者还研究了预后模型与免疫检查点基因表达之间的相关性,免疫检查点基因可以作为预测免疫反应的一个指标。如图8J所示,除SIGLEC15基因外,其他7个免疫检查点基因在TCGA队列的高危患者中均有下调。
图8 TCGA队列中3基因特征的免疫景观和免疫治疗预测8.3-基因特征的突变特征
已经确定体细胞高突变是PC的一个特征,因此比较了TCGA队列中高风险和低风险患者的突变情况。如图9A,B所示,高危患者的突变率高于低危患者。关于基因突变频率,KRAS、肿瘤蛋白p53(TP53)和SMAD家族成员4(SMAD4)是高危患者相比于低危患者改变最多的基因。此外,错义突变是PC患者中最常见的突变类型。
图9 3基因特征的突变图谱9.3-基因特征可以预测化疗药物的敏感性
化疗药物一直是治疗PC的主要手段,而预后不佳与化疗耐药性有关。在此,作者进一步预测了两个风险亚组对常见化疗药物的化疗反应。如图10A-G所示,高危患者对七种化疗药物(阿西替尼、喜树碱、依托泊苷、尼罗替尼、帕唑帕尼、舒尼替尼和替米罗莫司)的预测IC50s高于低危组患者,表明低危患者可以从化疗药物中受益。此外,发现高危患者对厄洛替尼和紫杉醇更敏感(图10H,I)。
图10 3基因特征的化疗反应预测四、总结
本研究中的预后模型由三个线粒体自噬相关基因(PRKN,SRC,VDAC1)组成,这三个基因的组合在临床预后评估中产生了良好的表现。PRKN,也称为PARK2,已被证明通过抑制炎症相关的免疫抑制来作为胰腺肿瘤发生的抑制剂。此外,研究还发现PRKN与六种免疫浸润细胞密切相关,这解释了它们在抗肿瘤免疫中的作用。SRC是一种非受体酪氨酸激酶,负责肿瘤细胞凋亡,迁移和转化。据报道SRC在PC样品中高度表达,且SRC的激活有助于PC致瘤性。VDAC1主要参与细胞体积调节和凋亡。据报道,VDAC1 mRNA和蛋白质在PC组织中高度表达,并且VDAC1的丢失显著抑制了PC细胞中的细胞生长,侵袭和迁移。因此,这三种线粒体自噬相关基因在PC肿瘤发生过程中起着至关重要的作用,并且可能具有作为潜在生物标志物的临床价值。
总之,作者开发并验证了一种用于PC患者预后分层的线粒体自噬相关基因特征。该新型特征可应用于PC患者治疗期间的生存和治疗反应预测。
网友评论