【科学论文摘介】 作者:华雪
如何有效地遏制新冠病毒的传播,目前极大地依赖于快速和准确地检测出病毒的存在。在中国,全员核酸普筛已被实践证明是行之有效的方法。核酸增倍检测法,包括逆转录实时聚合酶链式反应(RT-PCR),是最为广泛使用的方法。然而由于缺乏成熟有效的判断标准(称之为黄金标准),对检测结果的评估受到了一定阻碍。已经广泛认识到,潜在的“假阴性”结果的存在,会严重妨害到公共卫生系统的反应能力,造成正在流行的传播链无法阻断。在患者层面,有可能造成延缓对病毒感染者的识别,尤其是早期感染者或无症状的感染者,增加了对其他人群和医护人员的感染风险。更为重要的是,会延迟应急治理的启动。
目前,奥密克戎病毒株已成为全球占主导性流行的新冠病毒,它具有非常强的传播力、相对短的潜伏期、以及较高的轻症和无症状感染者的比例,这一特点给病毒假阴性的即时识别带来严重挑战,留给公共卫生部门作出即时反应和决策的“空窗期”大大缩短。
有研究表明,核酸检测假阴性的比例变化于1.8%至58%之间,这种变化性归因于病毒在体内的不均匀性、感染者年龄的不同、检测的时效、采集样本的种类、样本转运直至分析之前的其他环节、以及RT-PCR分析研判所采用的方法。
澳大利亚多个大学和研究机构的联合研究团队运用贝叶斯网络模型研究了新冠病毒检测结果与实际情形之间可能存在的偏差,以及如何对数据进行更为合理的解释。该模型的核心价值,在于深度理解整个核酸检测过程,在某个个体真实被感染的状态与检测结果之间架起桥梁,并可以应用于不同的背景环境、不同的检测方法和不同的病原体,为检测结果的解释增加了一种更为细化的方法。该项研究成果于2021年6月发表在剑桥大学出版社发行的公开论文集上。
必须强调说明,该论文并非针对奥密克戎病毒株,切忌直接应用于当前的抗疫工作,但所研究的贝叶斯网络模型方法对当前的防疫工作仍是可以借鉴的。对于如何建立数学模型,使之成为与医疗实践密切结合的知识集合,而非仅仅是数字与概率的堆叠,也有参考作用。本文对该项研究成果作一个概略的介绍,论文原文的网络链接附后。
什么是贝叶斯网络模型
所谓贝叶斯网络模型,是根据贝叶斯理论概率公式建立的一种数学模型,它将复杂问题相关的信息在因果关系网络基础上构建成不同的域。贝叶斯网络模型通常由两部分构成:(1)由一个个节点组成的图形,每一个节点代表一个因素(或变量)。这些因素或变量对于描述和理解所涉及的系统是至关重要的。为了描述这些因素之间相互的因果关系,用箭头连线把它们一一联结起来,箭头的方向代表在统计学意义上(常常具有因果关系)直接的依赖关系变量。(2)一系列有条件的概率分布图,它们界定了这些变量之间相互依赖的强度,并由此计算出所有变量统合起来之后的联合概率。
相关信息或变量可以划分为两大类,即可观测的和不可观测的。前者很容易理解,诸如体温、血压、实验室汇报的白血球数量等等,是可以度量的参数或变量;后者则例如肺部感染的具体(物理)状态,上呼吸道(嗓子里)的病毒载量等等,这些无法用肉眼直接看到变量,称为“潜变量”(latent)。然而很多时候潜变量虽然无法被非常精确地观察到或测量,我们可以通过测量可观测的因素来给潜变量做出大致的估计。比如观察到咳嗽,可以在一定程度上推断呼吸道感染了,实验室从咽拭子中检测出了病毒,则可以在很大程度上得出测试者的咽喉存在病毒。重点在于,测量出的部分(可观测的)和事物的真实状态(常常是难以直接观测的)有时候存在误差,明确地理解这两者之间的差异才能更好的估测事物的真实状态。
贝叶斯网络模型就是将这些变量之间的关系图形做出阐释,由相关领域的专家给出他们的经验判断,说明各种因素之间复杂的因果关系。这种方法在医学领域已经得到了应用,也在新冠病毒感染的研究中获得应用。例如,Fenton 及其合作者运用贝叶斯网络模型方法研究得出结论,不同国家由于取样方法、检测手段和报告程序的不同,导致新冠病毒感染者死亡率的差别和变化。
如何构建新冠病毒检测系统的贝叶斯网络模型
运用上述方法构建所需要的新冠病毒检测系统模型,如何确定新冠病毒检测过程中哪些是最为关键的变量?是建立模型的基础。这些变量是通过海量的文献阅读和回顾进行初步筛选,然后通过与领域专家的网络视频研讨会确定的。
由于这样的模型跨越了数学(包括概率论和统计学)与医学两大知识领域,且医学领域本身又可以划分出不同的专业领域,任何一个单独领域的专家都不足以具备涵盖所需要的全部知识。因此,跨领域专家之间的沟通和交流,成为建模的关键环节。该研究团队邀请了各个相关领域的资深专家,包括微生物学、感染病学、流行传染病学、公共卫生以及普通临床医学等多个领域。这些专家在相关领域具有极为丰富的专业知识和经验。
与医学领域专家沟通的人,必须具备数学模型的专长以及相关医学领域的基本知识,作为“协调员”,成为构建知识库的“知识工程师”。
在构建模型的过程中,需要对大量参数进行确定。其方法是,选择一个最初始的参数,得出一个符合基本医学观察和数学逻辑的定性结果,之后通过渐进式的逐步调整,以达到最符合客观观测状态的参数。这是一个不断反复、验证的过程,涉及到大量线上和线下集体研讨会,以及与领域专家一对一的细节讨论。
如何识别假阴性
图1是一个最为简单的例子,来说明两种情况。图左侧是一个病毒阳性感染者,即真实状态是100%为阳性;但根据贝叶斯网络模型,实验室检测出其为阳性的概率为85%,相应地有15%的概率检测为阴性,换句话说假阴性的概率为15%。图右侧为一个未被感染者,其真实状况为100%阴性;模型显示,实验室检测为阴性的概率为99.9%,相应地有0.1%的概率会被误检为阳性。需要说明的是,这里的数字是假定的,并非代表一种真实情况。
图1 - 图示说明新冠病毒感染者(左)和未感染者(右)被检测出阳性和阴性的概率,说明见正文。
以上仅仅是模型给出的一个非常概略和一般化的判断,可以适用于任何疾病的诊断,包括新冠病毒或其他病毒的测试结果。更为精确的判断则通常面临巨大的挑战,原因在于,我们所关心的个体是否被感染的真实状态是未知的(也是难以直接观测的),这也就是为什么需要进行检测的原因。通过获得某个个体更多的背景材料(例如年龄、身体状况、有否到过感染区域、取样的种类和位置等等),模型可以有针对性地对具体个例获得进一步的改进。
在一般性模型基础上,该研究团队通过增加其他变量,诸如样本是如何采集的、采集的部位(例如是咽拭子或鼻拭子、抑或是呼吸道深部)、如何转运的、如何萃取的,以及如何分析和放大处理的,给出了更为复杂的模型,这些因素对假阴性的影响逐一进行了评估。例如实验室分析过程中的检测阈值Ct,如果设定过低(低于35)将增加假阴性的概率;反之Ct值设定过高(等于或大于40)则增加了假阳性的概率。通过参数的逐一设定,该模型对新冠病毒检测的敏感性、针对性、可能性和确定性作了更为详细的说明,并给出了新冠病毒RT-PCR检测的贝叶斯网络模型结构图(参见图2)。
图2 - 新冠病毒RT-PCR检测的贝叶斯网络模型结构图
作为一般性读者,了解上图中每一项参数的含义以及它们之间的相互因果关系,看懂模型的结构,是过具挑战性了。这些工作,让感兴趣的专业工作者去做吧 (参见附注的原文链接)。
概括来说,图中间的黄色图框是病毒的轨迹,多大程度上能成功地检测到这个轨迹,取决于粉色图框和橘色图框所代表的变量的状态,它们会大大影响到病毒轨迹的监测质量。
论文例举了四种不同的情况,对模型的可能应用场景做了说明。必须强调,模型所用的参数并非真实数据,而是模拟的,切不可将它们直接应用于实际病例的判断。特别是所模拟的病毒传染力是根据2021年6月之前的数据,相较于当前的奥密克戎病毒株完全不同。
第一种情况:有症状或无症状的个体,暴露于存在新冠病毒的环境以及暴露时间的长短对检测结果的影响。例如一个老年个体,曾经(1-7天之前)短暂暴露于病毒环境(比如咖啡馆),且目前没有症状。该个体当前被感染的概率为1.1%,鼻咽拭子检测为阳性的概率为1.0%,相应的假阴性概率0.2%。假如该个体较长期地暴露于病毒环境(比如与感染者居住在一起),感染的几率曾至7.9%,鼻咽拭子检测阳性的概率6.4%以及检测时假阴性的概率为1.6%。但如果某个个体在接触病毒之后(1-6天)出现了症状,其被感染的概率达96.5%,检测为阳性的概率为92.3%,假阴性的概率为4.2%。
第二种情况:样品质量对感染者检测为阳性结果的影响。上述情况的老年个体,暴露于存在新冠病毒的环境中达1到7天,在采集鼻咽拭子的情况下,若采样质量不高,样品转运条件较差,检测为阳性的概率为89.2%,结果无法确定的概率为6.5%,假阴性的概率为10.8%。但如果上述采样和转运条件完善的话,检测为阳性的概率为95.9%,结果无法确定的概率为0.6%,假阴性的概率为4.1%。
第三种情况: 对于具有假阴性结果的患者身体状况的了解。已被病毒感染的较为年轻的成年个体,如果检测为阴性,则有69.8%的可能性在检测的时候无症状,远高于检测为阳性的人(27.6%)。
第四种情况:病毒流行的强度对假阴性比例的重要影响。在低强度流行的情况下(设人群中感染率0.1%),没有症状的个体与具有上呼吸道症状的个体,检测结果为假阴性的概率分别为0.3%和14.6%。在高强度流行的环境中(设人群中感染率5%),出现呼吸困难(而非上呼吸道症状)的个体,若检测为阴性,其假阴性的概率高达76.5%。
相关问题的讨论
对新冠病毒感染作出准确判断,对于患者诊治和公共卫生防疫措施的实施至关重要。随着检测数据极大地增加,对数据作出正确的分析和评估,对于了解病毒感染的流行现状和趋势是不可或缺的重要步骤。大量现有参照数据出自商业实验室,属于密切管控下的非临床样本。一系列的因素,包括年龄、是否暴露于病毒环境及时间长短、是否有症状及出现的天数、采样人员的技能以及分析方法的复杂程度,都会影响到核酸检测结果为阴性或阳性,进而影响到对数据的解释和评估。
文章作者认为,建立新冠病毒检测的贝叶斯网络模型的核心价值,在于可以将影响检测结果的诸多因素之间交互作用的复杂因果关系联系起来,从而对个体是否被病毒感染的真实状况与相应的检测结果之间潜在的偏差作出更准确的评估,对可能存在的假阳性和假阴性结果产生的原因和可能性作出正确的判断。
在群体层面上,该模型表明,病毒在所在区域传播流行的强度,对检测结果的解释有很大影响。模型还可以帮助对采样和检测流程进行评估,识别出可以改进的步骤和环节。当模型通过实践,使诸多参数得以校正,模型将更符合所在地区的特点和环境,进而帮助公共卫生部门对管控疫情作出更为即时的优化措施。
模型也可以应用于针对个体患者的诊疗过程。根据患者的年龄、身体状况、新冠病毒暴露史、采样部位和质量,以及分析方法和流程,即时对检测结果的假阳性或假阴性作合理的判断,避免误判和误诊。
此外也对样品采集部位、代表性、样品转运过程、工作人员的技能以及分析方法的成熟程度等非医疗的、但对假阴性结果的可能性有重要影响的因素,作了讨论。
模型的局限性
作者也毫不隐讳地指出了该模型的局限性。当模型应用于辅助个体患者或公共卫生决策时,必须保证对数据质量的检验与核实。领域专家的意见未必一定是正确的,有些情况下,现有知识和经验可能不足,同一领域的顶级专家之间对所关心的问题可能存在不同的认知。因此,对当前的病毒流行可能无法得出一般性的结论。此外,在将模型应用于实际情况之前,必须对模型所使用的参数做具体选择和模型检验,特别是那些关键性参数,包括新冠病毒流行的地点和涉及到的人口,是否存在其他具有相似症状可以感染呼吸系统的病毒在流行,以及采样部位病毒载量的变化带来的影响。该模型还仅仅是一个理论模型,将具体地区的真实数据应用到模型中进行检验、评估和调整,才有可能在抗疫工作中获得实际的应用,发挥更大的作用。
附注
原论文标题:Bridging the gaps in test interpretation of SARS-CoV-2 through Bayesian network modelling (DOI: https://doi.org/10.1017/S0950268821001357)
发表于: © The Author(s), 2021. Published by Cambridge University Press. This is an Open Access article, distributed under the terms of the Creative Commons Attribution licence (http://creativecommons.org/licenses/by/4.0/), which permits unrestricted re-use, distribution, and reproduction in any medium, provided the original work is properly cited.
网友评论