Circulating Protein Biomarkers for Use in Pancreatic Ductal Adenocarcinoma Identification
循环蛋白生物标志物在胰管腺癌鉴定中的用途
发表期刊:Clin Cancer Res
发表日期:2021 Mar 18
影响因子:10.107
DOI: 10.1158/1078-0432.CCR-20-4215
一、研究背景
胰管腺癌(PDAC)是一种不乐观的疾病,只有不到10%的患者在确诊后存活5年。PDAC目前是癌症相关死亡的第四大原因,但预计到2030年将成为第二大原因。PDAC的症状最初是模糊的,80%的患者被诊断为晚期。因此,在肿瘤仍有可能治愈的早期阶段检测PDAC至关重要。
炎症是癌症的标志,也是PDAC的已知危险因素。慢性胰腺炎常与PDAC同时存在。此外,PDAC的一个特殊标志是肿瘤中由细胞和非细胞成分组成的致密的脱细胞基质。
二、材料与方法
1 数据来源
5个不同群体的985份血清样本:1) 701名PDAC I-IV期患者,2) 26名慢性胰腺炎患者,3) 38名IPMN患者,4) 38名良性胰腺疾病患者,5) 180名健康献血者。
2 分析流程
1)测定血清中CA19-9的水平
2)使用Olink Proteomics公司的Proseek多重免疫肿瘤学检测法,对血清样品进行92种蛋白质的分析(基于PEA技术)
3)生信分析
3 两位生物信息学家的独立分析
第一种方法:1)主成分分析;2)模型生成:第一步探索在逻辑弹性网(LASSO和Ridge)回归模型中作为预测因子的完整差异表达蛋白集的性能和稳定性,第二步是通过评估蛋白质标志在发现和复制队列中的表现,从第一步中找到表现最好的蛋白质标志;3)ROC曲线评价模型性能;4)Bootstrapped评估参数:使用2000个分层引导复制的95%置信区间对所有评价参数(AUC、灵敏度、特异性、PPV和NPV)的稳健性进行研究。
第二种方法:排除了3名患者;1)主成分分析;2)在发现队列中测试了七个模型建立策略,目的是将CA19-9纳入分析中,因此选择了在PDAC与非PDAC上训练的LASSO-正则化逻辑回归模型;3)使用glmnet R包对LASSO模型进行训练。
三、结果展示
01 - 差异化表达的血清蛋白
测定了Olink免疫肿瘤面板中的92种蛋白质和CA19-9在PDAC患者和非PDAC个体之间的差异表达(所有非恶性胰腺疾病患者和健康个体)。与非PDAC个体相比,PDAC患者78种蛋白质的NPX值有显著差异。三种蛋白质(CA19-9、IL8和MMP7)的NPX值也有超过log2倍的变化。图1中给出了说明P值和log2FC变化之间关系的火山图。
02 - 诊断性血清蛋白特征:指数I,及敏感性分析
第一种统计方法确定了19个候选蛋白标志模型,用于分离PDAC患者和非PDAC个体。这19个签名的蛋白质数量不断减少,并由此增加了所含蛋白质组成的稳定性。在19个候选蛋白模型中,包括9个蛋白的签名+CA19-9(命名为指数I)在AUC、灵敏度、阳性预测值(PPV)、所含蛋白的稳定性和蛋白数量方面被认为是表现最好的。
指数I由以下蛋白质组成:T细胞表面糖蛋白CD4(CD4)、细胞毒性和调节性T细胞分子(CRTAM)、Fas配体(FASLG)、IL8、IL10、单核细胞趋化蛋白3(MCP-3)、MMP-7、TNF相关凋亡诱导配体(TRAIL)、VEGFC和CA19-9。
与非PDAC个体相比,PDAC患者中大部分蛋白的表达量更高。然而,对于FASLG、TRAIL和VEGFC,与非PDAC个体相比,在PDAC患者中发现了较低的蛋白表达。在发现队列中的指数I,比较PDAC所有阶段与非PDAC个体,给出的AUC为0.93,敏感性为0.86,特异性为0.85,PPV为0.93。在复制队列中,所有阶段的PDAC与非PDAC个体的AUC为0.92,敏感性为0.95,特异性为0.76,PPV为0.90。
在发现队列和复制队列中对每个签名进行了评估,以确定其将PDAC I/II期和III/IV期患者与非PDAC个体分开的能力。在发现队列和复制队列的训练和测试集中对模型进行了训练和测试,这样就得到了AUC为0.92和复制队列中的0.96。当将PDAC患者与健康个体单独比较时,发现和复制队列中AUC为0.99和0.99。PDAC患者与非恶性胰腺疾病合并患者相比,在发现和复制队列中给出的AUC值为0.85和0.80。
图2A-C显示了所有PDAC患者与所有非PDAC个体(A)相比,以及PDAC患者按阶段划分的两组:I/II期(B)和III/IV期(C)
03 - 诊断性血清蛋白特征:指数II,及敏感性分析
在第二种统计方法中,模型的训练是通过重复500次的交叉验证步骤进行的。在这个过程中,23个蛋白+ CA19-9的回归系数(权重)始终大于零,从而形成第二个签名,指定为指数II。
当比较PDAC患者与非PDAC个体时,指数II在发现队列中给出的AUC为0.96,灵敏度为0.87,特异性为0.91,PPV为0.96。在复制队列中,PDAC患者与非PDAC个体给出的AUC为0.93,敏感性为0.91,特异性为0.81,PPV为0.92(图2,底部)。
当根据阶段分成两组(I/II和III/IV)时,PDAC与非PDAC相比,在复制队列中给出的AUC值为0.90(PDAC阶段I/II与非PDAC个体)和0.95(PDAC阶段III/IV与非PDAC个体)。将PDAC患者与健康个体单独比较,在发现和复制队列中,AUC值分别为0.996(95% CI,0.994-0.999)和0.998。PDAC患者与非恶性胰腺疾病合并患者相比,在发现和复制队列中分别给出了0.89和0.84的AUC值。
图2D-F给出了所有PDAC患者与所有非PDAC个体相比(D),以及PDAC患者按阶段分为两组:I/II期(E)和III/IV期(F)的ROC曲线与相应的指数II的AUC值。
04 - 两个指数的比较
指数I中包含的所有9种蛋白+ CA19-9也在指数II中被发现(见补充图S2)。当按照对模型的贡献权重(回归系数)对指数Ⅱ中的蛋白质进行排序时,指数Ⅰ中包含的9种蛋白质中的6种(MMP-7、TRAIL、FASLG、VEGFC、CD4和IL10),以及CA19-9都在指数Ⅱ中排名前10位。从指数II中对模型贡献权重最大的15种蛋白质排名来看,指数I中的9种蛋白质中,有8种蛋白质+ CA19-9也在其中。指数I中的所有蛋白质都在指数II中表现最好的16个蛋白质中(补充图S3)。
图3显示了箱形图,说明了各蛋白和CA19-9在指数I和指数II中按诊断分层的差异表达。
当将CA19-9排除在分析之外时,指数导致指数I中发现和复制队列的AUC为0.90和0.88,指数II中发现和复制队列的AUC为0.94和0.89(补充图S4)。
05 - 慢性胰腺炎和IPMN患者后来发展为PDAC的患者
随访期间仅1例慢性胰腺炎和1例IPMN患者被诊断为PDAC。慢性胰腺炎和IPMN患者的中位随访期为4.4年。这两名患者在纳入BIOPAC研究后分别诊断为35个月(慢性胰腺炎患者)和14个月(IPMN患者)。慢性胰腺炎患者的NPX值高于PDAC患者的中位,其指标包括CCL20、CXCL1、FASLG(以下)、TRAIL(以下)和VEGFC(以下)。对于FASLG、TRAIL和VEGFC,PDAC患者的NPX值中位数低于非PDAC患者,慢性胰腺炎患者的NPX值低于PDAC患者的中位数。
IPMN患者的NPX值高于PDAC患者的中位数,这些指标包括:CCL23、CCL3、CD4、CD40L、IL10、IL33、MIC-A/B和PD-L2。
四、结论
作者开发了两种用于诊断PDAC的循环蛋白签名:一种是9种蛋白+碳水化合物抗原19-9(CA19-9),一种是23种蛋白+CA19-9。这些特征可将PDAC患者与非恶性胰腺疾病患者和健康献血者对照组区分开来。这些特征有可能改善PDAC的诊断工作,并导致在疾病的早期阶段进行诊断,使切除率增加,从而提高PDAC患者的生存率。
网友评论