今天小编就和大家分享一篇研究肺腺癌预后的文章
提高早期肺腺癌预后准确性的跨组学生物标记模型
肺癌是全球癌症相关死亡的主要原因,其中肺腺癌(LUAD)是最常见的类型,约占所有肺癌病例的40%,其发病率在全球范围内呈上升趋势。随着诊断技术的进步,更多的LUAD患者可以在早期诊断,并且早期LUAD患者预后相对较好,但患者之间的分子异质性可能导致LUAD生存的个体差异,其机制仍不清楚。
流程图:
数据:
来自5个队列的825例早期LUAD患者的临床信息、DNA甲基化和基因表达数据,并将其分为训练集以及验证集,其临床以及统计学特征如下表所示
结果:
一、预后相关的DNA甲基化和基因表达探针
图1
这项研究使用了来自COSMIC的719个癌症相关基因以及相应的12806个DNA甲基化探针。图1A展示了Ranger筛选出的DNA甲基化探针。图1B展示了验证集中的甲基化探针。在转录组分析中,作者使用同样的方法筛选基因探针,图1C,D分别展示了训练数据以及验证数据中得到的基因探针情况。
二、调控关系分析
图2
在这一部分作者研究DNA甲基化影响生存的潜在机制。作者评估所有成对的DNA甲基化-基因表达-LUAD生存通路的关系,并考虑DNA甲基化与基因表达之间的顺式和反式调控模式,最终得到六个通路。进一步,计算了DNA甲基化风险评分(MRS)和基因表达风险评分(GRS),发现在两个阶段中GRS介导了MRS对生存的影响,如图2所示。
三、跨组学生物标记预测模型在不同患者中的预测效能
图3
在这一部分作者主要对得到的跨组学生物标志物结合多种临床因素进行分析,来验证其对于患者的划分能力,文章在训练集和验证集中都执行了只用临床因素以及将临床因素与生物标志物结合来划分患者,生存分析图如图3所示,研究发现结合跨组学生物学标志物可以显著提高预测能力。
四、跨组学生物学标记模型预测效能
图4
在这一部分作者使用两种预测模型(i)临床模型和(ii)跨组学模型(clinical + MRS + GRS)预测3年和5年生存率,这两种是重要的临床预后结果。采用多因素加权的预测因子的线性组合,建立了风险评分模型。将得到的风险模型与仅包含临床信息的模型相比,跨组学模型在训练阶段的预测准确率有显著提高,3年auc高达86.1%(图4A),5年生存率预测为87.2%(图4C)。验证阶段进一步证实了跨组学模型在预测方面的显著改善,其中3年auc高达84.1%(图4B),5年生存率预测为85.3%(图4D)。
五、Nomogram开发和验证
图5
作者为了便于将模型应用于临床实践,结合患者的临床信息和跨组学特征,开发了一个nomogram,并在TCGA患者中进行了进一步的测试。这nomogram是基于多变量Cox比例危害模型得到的。接着又使用所有预测因子计算加权评分来估计3年和5年OS,得到的nomogram在图5。
到这里,这篇文章的主要内容就介绍完了,文章采用机器学习方法,建立了包含12个DNA甲基化探针和7个基因表达探针的预测模型,该模型可以显著提高肺腺癌的预后预测准确对,并且研究的方法角度过程都可以参考借鉴呦。
网友评论