生信小课堂
影响因子:8.713
研究概述:作为最具侵袭性的肿瘤,胰腺癌(PACA)的治疗在过去十年中没有明显改善。基于解剖学的TNM分期并不能准确识别治疗敏感的患者,精密医学迫切需要理想的生物标志物。作者筛选了32个共识预后基因,结合10种机器学习算法,76种组合,构建了(artificial intelligence-derived prognostic signature)AIDPS模型。训练队列、测试队列、外部验证队列的结果一致表明,AIDPS可以准确预测PACA的预后。在纳入了几个重要的临床病理学特征和86个已发表的签名后,AIDPS表现出强大且显著卓越的预测能力。此外,在其他流行的消化系统肿瘤中,九基因AIDPS仍然可以准确地分层预后。AIDPS对PACA具有重要的临床意义。高AIDPS组具有可观察到的延长生存期,而panobinostat可能是高AIDPS患者的潜在药物。此研究提供了一个有潜力的工具,可以进一步指导PACA的临床管理和个性化治疗。
机器学习目前在肿瘤和非肿瘤生信中越来越常见,不管是构建模型还是筛选关键基因,都有很出色的发挥。想做类似分析的朋友,欢迎交流!
流程图:
研究结果:
胰腺癌症共识签名的综合开发
基于单变量Cox回归,作者在训练和9个测试队列中筛选了32个(consensus prognostic genes) CPG(图2B)。在PACA-AU-Array训练队列中,作者应用了76种算法组合来构建预测模型,并计算了其余9个测试队列中每个算法的平均C指数。如图2A所示,计算所有13个队列中每个样本的AIDPS分数。
AIDPS的预后价值
作者将PACA患者分为高AIDPS组和低AIDPS组。OS和RFS的Kaplan-Meier曲线表明,高AIDPS组在PACA-AU-Array训练队列中的存活率明显更长(图3A-B)。在消除批次效应后,合并了10个队列的数据也表现出相同的趋势(图3C-D)。进一步多变量Cox分析了几个重要的临床特征,结果表明,AIDPS是PACA-AU-Array队列中OS和RFS的独立保护因子(图3E-F)。在融合队列中也发现了类似的结果(图3G-H)。
在九个测试队列中,Kaplan-Meier曲线与低AIDPS组相比,高AIDPS组的OS持续延长。同样,RFS的比较还表明,在TCGA-PAAD、PACA-CA-Seq和E-MTAB-6134队列中,高AIDPS组患者的复发率明显低于低AIDPS组。调整了可用的临床病理学特征后,多变量Cox分析结果仍然表明AIDPS是OS的独立预后因子。RFS的多变量结果还显示,AIDPS在TCGA-PAAD、PACA-CA-Seq和E-MTAB-6134中仍然具有统计学意义。
AIDPS的强大预测性能
PACA-AU-Array训练队列和Meta-Cohort的校准曲线表明,AIDPS具有良好的预测性能(图3I-J)。1年、2年和3年OS的ROC曲线(AUC)下的面积在PACA-AU-Array培训队列中为0.715、0.748和0.671,在元队列中为0.717、0.719和0.719(图3K-L)。在多个独立队列中,AUCs大于0.65的结果表明,AIDPS可以稳定而有力地预测PACA患者的预后。
作者在包含临床信息的八个队列中对比了AIDPS的预测疗效和这些常见的临床特征。C指数的结果表明,AIDPS的准确性明显提高了这些特征(图2C-J)。
对比在PACA中已发布的86个模型
作者收集了86个已发布的mRNA/lncRNA预后特征,以比较AIDPS和这些模型的预测准确性。单变量Cox回归的结果显示,只有本研究的AIDPS和Demirkol CS的20基因特征在所有独立队列和融合队列中都具有一致的统计意义。(图4A)
作者又通过C指数比较了AIDPS和这86个签名的预测能力,整个训练队列、九个测试队列和融合队列。本研究的AIDPS在几乎所有队列中都表现出明显优于其他模型的准确性,揭示了AIDPS的稳定性。值得注意的是,各种预后签名在其TCGA-PAAD培训队列中拥有更高的C指数,但在其他队列中表现不佳,这可能是由于过度拟合的广义能力受损(图4B)
上述结果表明,九基因AIDPS可以有力地预测PACA患者的预后。
AIDPS的临床特征
作者进一步比较了高AIDPS组和低AIDPS组之间的几个熟悉的临床特征,结果表明年龄、性别和TNM阶段没有统计学差异。(图5A-C)低AIDPS患者的评分更高,这可能意味着更差的预后(图5D)。
鉴于PACA中AIDPS的出色预测能力,还测试了其在其他几种常见消化系统肿瘤中的表现。如图5E-H所示,在四个肿瘤中,包括LIHC、STAD、COAD和READ的低AIDPS组患者的Kaplan-Meier生存曲线表现出明显的OS。这些结果支持了作者的假设,表明在PACA中构建的AIDPS作为生物标志物,具有推广到其他肿瘤的广泛前景。
AIDPS的潜在生物机制
高AIDPS组在消化和新陈代谢相关途径方面非常丰富(图5I-J)。虽然低AIDPS组主要与T细胞增殖、IL-17信号通路和其他免疫相关通路的调节相关,但也与增殖相关的生物过程相关,这部分解释了其更差的预后(图5K-L)。
AIDPS的基因组改变景观
对突变和拷贝数改变进行了全面分析(图6A)。如图6C所示,低AIDPS组具有明显更高的肿瘤突变负担(TMB)。结合TCGA中的10种致癌信号通路,作者发现经典肿瘤抑制基因TP53、CDKN2A和癌基因KRAS在低AIDPS组比在高AIDPS组中更频繁地突变,而SMAD4、TTN和RNF43则相反。(图6A-B)
与高AIDPS组相比,低AIDPS组在局灶和染色体臂水平上明显具有更高的扩增或缺失(图6A,D)。8q24.21内癌基因MYC的明显扩增,以及9p21.3和18q21.2内肿瘤抑制基因CDKN2A、CDKN2B和SMAD4的明显缺失,这一结果在基因水平上再次得到证实。(图6A)低AIDPS组的癌基因扩增和肿瘤抑制基因缺失可能导致其预后不佳。
AIDPS甲基化驱动事件
作者筛选了四个甲基化驱动基因(MDGs),其甲基化水平与PACA中匹配的基因表达水平呈显著反比关系。与低AIDPS组相比,高AIDPS组具有较高的MAP3K8和PCDH7甲基化水平,以及明显较低的mRNA表达水平,而PCDHB1和SPAG6则相反(图6E-F)。Kaplan-Meier分析表明,MAP3K8和PCDH7的甲基化水平较高,SPAG6的甲基化水平较低,为高AIDPS组带来了显著延长的OS(图6G-H,J)。PCDHB1也表现出与SPAG6类似的趋势,但没有达到统计学意义(图6I)。
AIDPS的免疫景观和分子表达
根据单样本基因集富集分析(ssGSEA),作者发现低AIDPS组表现出相对较高的免疫细胞类型浸润丰度(图7A-B)。此外,在27个ICM中,低AIDPS组的相对表达水平急剧增加(图7C)。这些结果一致表明,低AIDPS的PACA患者更有可能对免疫治疗产生反应。
九个AIDPS基因的预后价值和生物学相关性
基于来自训练队列、九个测试队列和三个外部验证队列的大型多中心生存数据,作者使用AIDPS及其九个基因作为连续变量对生存变量进行了综合单变量Cox回归分析。总体而言,与仅九个AIDPS基因相比,作者的AIDPS带来了显著的性能改进。在基因组改变方面,还观察到与AIDPS呈正相关,SELENBP1和PLCB4在具有优越突变和CNA频率的低AIDPS组中显著较低,这表明它们与TMB和CNA负担呈显著负相关。
AIDPS用于免疫治疗的预测价值
基于肿瘤免疫功能障碍和排斥(TIDE)网络工具,低AIDPS组导致TIDE评分显著降低,免疫治疗反应率更高(图8A-B)。低AIDPS患者的表达模式与对ICIs有反应的黑色素瘤患者的表达模式更相似(图8C)。这些结果表明,低AIDPS组更有可能从免疫治疗中受益。
寻找高AIDPS组的潜在治疗剂
如图8E所示,作者为高AIDPS的PACA患者开发了潜在的药物,并同时在混合物中分析相对抑制(PRISM)数据集。结果表明,PAK1表达低的患者具有明显较低的估计AUC值,这表明对吉西他滨的敏感性更高(图8F)。生成了四种CTRP衍生制剂和九种PRISM衍生制剂。这些药物的估计AUC值不仅在统计学上与AIDPS分数呈负相关,而且在高AIDPS组中也明显较低(图8G-J)。
作者根据PACA患者和正常对照组之间的差异表达谱,进一步识别PACA的候选化合物,最终获得了两种候选化合物:ATP酶抑制剂ouabain和组蛋白脱乙酰酶(HDAC)抑制剂panobinostat。其中,panobinostat在PACA患者中高度敏感,这表明它可能成为高AIDPS组PACA患者的潜在治疗剂(图8D)。
研究总结:本研究中,作者通过机器学习算法组合构建并验证了一个预测模型(称为AIDPS)。AIDPS表现出强大和显著卓越的预测能力。值得注意的是,作者的AIDPS对PACA的临床管理和个性化治疗具有重要的临床意义,低AIDPS患者对免疫治疗更敏感,而panobinostat可能是高AIDPS患者的潜在药物。此外,在其他流行的消化系统肿瘤中,九基因AIDPS仍然可以准确地分层预后。总体而言,本研究为临床实践中PACA患者的预后评估、风险分层和个性化治疗提供了一个有吸引力的工具。
网友评论