Nat MI | 应用于临床试验的自动因果推理
原创 风不止步 图灵基因 2022-05-18 13:24
收录于合集#前沿生物大数据分析
撰文:风不止步
IF=16.649
推荐度:⭐⭐⭐⭐⭐
亮点:
文章提出了一种用于医学数据分析的自动工具--自动因果推理算法(AutoCI),以新的角度研究患者变量的因果关系,提供信息丰富的关键证据来支持临床解释,准确确定和排除虚假(非因果)变量是未来实现更精确患者分层的关键步骤。
2022年4月25日,瑞士University of Zurich的Viktor H. Koelzer博士等人在《Nature machine intelligence》上发表了一篇“Automated causal inference in application to randomized controlled clinical trials”的文章,文章提出一种基于不变因果预测 (ICP) 框架的新自动因果推理方法 (AutoCI),用于对临床试验数据进行因果重新解释。
临床医学中,随机对照试验 (RCT) 被认为是研究因果关系的金标准。在原型RCT中,参与者被随机分配到实验组或对照组,进行观察。在因果推理的背景下,可以使用 do-intervention对这种随机化进行建模。
图 1:提出的 AutoCI 的整体模型说明和性能。
文章开发了一种新的自动因果推理方法(AutoCI),并将其应用于1990-1997年和2002-2006年间在荷兰进行的两项大规模和实践性改变的子宫内膜癌患者随机对照试验,具有完整的临床病理学数据集和成熟的结果数据。子宫内膜癌是发达国家女性最常见的妇科癌症。大多数被诊断患有早期子宫内膜癌(EC)的女性预后良好并接受手术治疗。大约15-20%的患者预后不良,远处转移的风险很高。对于这些患者,根据其风险组推荐不同的辅助治疗,如阴道近距离放射治疗、外照射放疗和放化疗。研究中使用的两项试验(PORTEC 1和2)通过调查这些疗法如何影响复发率和生存风险,为临床实践做出贡献。根据最新的ESGO/ESTRO/ESP子宫内膜癌患者管理指南,风险分类是基于肿瘤分级(Grade)、淋巴血管间隙浸润(LVSI)、子宫肌层浸润和分子变量,包括但不限于聚合酶ε突变体EC(POLEmut)、错配修复缺陷 (MMRd) EC、p53异常EC (p53abn)和没有特定分子谱(NSMP)的EC。在最近的一项研究中使用相关统计方法来调查这些变量与EC复发的危险相关性。有证据表明这些变量会影响EC复发,但尚未进行系统调查以支持从现代因果推理的角度理解。
因果推理可解决从数据确定因果关系的问题。当给出观察性数据或包含额外的干预性数据时,临床研究旨在(1)量化治疗给定结果的因果效应或(2)推断患者与治疗特征和相关结果之间关系的潜在因果结构。前者可以很好地表述为以不同治疗为条件的结果预期之间的差异(平均因果效应)。广泛的研究建立在这种方法论的基础上,包括但不限于目标试验规范、目标试验模拟以及将随机试验的推论扩展到新的目标人群。
与因果效应识别相比,将(2)称为(因果)结构识别。结构识别的目标往往是学习整个因果结构,即由节点和连接节点组成的有向无环图;然而,这通常是一个非确定性多项式时间难题。为了在不推断整个因果结构的情况下学习因果关系,提出不变因果预测(ICP)来确定给定结果变量的因果变量集。在ICP框架下,使用随机变量概念(将一组可能的样本分配给可测量数量的函数)并定义因果变量。
图 2:Toy数据集上最优类型安全的学习性能和时间。
研究提出一种新的自动因果推理算法(AutoCI)。以两个大型RCTs为实验环境,从因果关系的角度重新解释临床变量。与现有的ICP方法相比,拟议的AutoCI在确定存在隐性混杂因素的因果变量方面表现出一致的优势。作为对标准危害分析的补充,AutoCI为医疗数据分析提供一个自动的工具,从新的角度研究患者变量的因果关系,为支持临床解释提供信息和关键证据。具体来说,准确判断和排除假性(非因果)变量是未来实现更精确的患者分层的关键步骤。
AutoCI的设计选择。与通用算法不同,临床算法必须在确保安全性和稳健性方面应对独特的挑战。容易出错的算法有可能导致医疗护理中的关键错误。在开发安全关键应用的需求驱动下,AutoCI采用了一种类型安全的程序合成方法。通过进一步将新提出的因果意识模块纳入该框架,合成一个适合因果意识学习的可区分类型安全候选程序子集。与费力且容易出错的手工函数设计相比,这种实现方式提高AutoCI的效率和安全性。
与现有ICPs的比较。先前的ICP方法的应用已经证实实验中因果变量学习的可行性(图2)。在没有混杂因素的情况下的出色结果证实这一点;然而,先前的ICP在合成实验上的容错实现并不能很好地满足实际的临床应用,尤其是在有隐藏混杂因素的情况下。与ICP、AICP和NICP相比,AutoCI在实验和PORTEC实验上都呈现出稳健的结果。随着混杂因素的加入,AutoCI在PORTEC的因果变量和非因果变量之间表现出稳健的区分,并在有限样本和ABCD设置上都取得了优异的定量得分。
图 3:在 PORTEC 数据集上进行危害分析的评估指标。
重要的是,使用AutoCI对临床病理和分子变量进行的危害分析和排序与常见的生物学和临床解释基本一致。以病理变量为例,研究确实表明,等级、子宫肌层深部侵袭和LVSI是早期EC复发的重要独立预测因素。因此,AutoCI提供的因果概率给出了关于每个变量对结果确定的相关性的额外信息,而且每个变量的可能性与领域专业知识相一致。淋巴侵袭被认为是独立于分子亚组的关键预测因素,并以最高因果概率排名,而等级和子宫肌层侵袭确实是较弱但独立的预后指标。
此外,AutoCI正确识别了EC分子变量的预后关联,为结果分配了适当的危害,并按照专家领域知识所预期的因果概率顺序对分子亚组进行排序。具有最高不良风险的分子因素,p53异常和L1CAM过度表达是公认的,而POLEmut始终与疾病复发风险降低有关,这在以前的研究中得到证实。正如专家预期的那样,增加一个免疫变量可进一步完善模型,并突出细胞毒性T细胞反应和早期EC复发之间的因果关系。综上所述,AutoCI在临床试验环境中正确地对患者结果的因果病理、分子和免疫变量进行量化和排序。
拟议的AutoCI用一种新的因果驱动方法扩展了研究人员目前的统计工具箱,该方法可以将因果可能性分配给预言和预测变量。因此,该方法将能够在癌症研究中越来越多的生物标志物中识别出与临床结果有统计学关联的临床相关变量。因此,尽管该方法的直接现实应用主要是科学方面,但随后的临床验证和发展可能会使人们更好地选择(生物)标记物来对癌症治疗和预测预后进行分层。总之,研究分析了多个RCT之间的因果变量确定,并在Toy和PORTEC实验中展示其优于比较方法的优势。对于临床应用,需要在独立的临床试验数据集中进一步验证该方法,以确保泛化。
教授介绍
Viktor Koelzer 苏黎世大学医学博士教授
Viktor Koelzer教授在德国、美国和瑞士接受医学培训。获得了董事会认证的病理学家,热衷于将技术应用于日常诊断实践和研究。目标是通过实施以胃肠道疾病和肿瘤免疫学为重点的高质量、科学驱动的计算图像分析方法来改善患者护理。在学术医院环境中实施数字病理学基础设施的项目领导经验。欧洲病理学会、美国和加拿大病理学会、辉瑞研究基金会和国际病理学会英国分部的资助者和获奖者。图像分析专利持有人。
参考文献
Ji Q. Wu, NandaHoreweg et al.Automated causal inference in application to randomizedcontrolled clinical trials(2022)
网友评论