摘要:fMRI具有相当大的潜力,可以作为一种转化工具,用于理解风险、确定干预措施的优先次序,以及改善大脑障碍的治疗。然而,最近的研究发现,许多最广泛使用的功能磁共振成像测量方法的可靠性较低,削弱了这一潜力。在这里,我们认为许多功能磁共振成像测量是不可靠的,因为它们被设计用来识别群体效应,而不是精确地量化个体差异。然后,我们强调了四种新出现的策略[扩展聚合、可靠性建模、多次回波功能磁共振成像(ME-fMRI)和刺激设计],它们建立在已建立的心理测量特性上,以产生更精确和可靠的功能磁共振成像测量。通过采用这些策略来提高可靠性,我们对fMRI作为一种临床工具的潜力感到乐观。
1. 我们能可靠的测量脑功能的个体差异吗?
认知神经科学彻底改变了我们对大脑如何支持从基本感觉到复杂认知过程的行为功能的理解。基于这些对大脑和行为的基本认识,一个新兴的转化神经科学项目寻求识别这些模式的个体差异,并以此为临床生物标记的发展提供信息,这些生物标记可用于预测疾病风险,优先考虑干预措施,并改善治疗。这些努力的核心是功能磁共振成像(fMRI),因为它提供了对人类一生行为中大脑活动的非侵入性测量。
近年来,fMRI对临床意义领域个体差异的研究激增,对临床应用的期望也随之增加。使用fMRI进行的个体差异研究的扩展引发了对其是否准备好满足临床转化所需的测量特性的质疑,其中最重要的是可靠性。
心理测量学早就确立了可靠性是效度的第一步。例如,要研究大脑功能是如何使一个超级老人在神经退行性变时具有弹性的,或者要根据个人独特的功能地形来调整大脑刺激,我们必须首先能够可靠地测量大脑功能的特质。为了建立可靠性,在个体无显著变化(如疾病进展、接受治疗)的情况下,对大脑功能的重复测量必须产生收敛估计。最近,我们报道了许多在临床相关行为中被广泛采用的任务-功能磁共振成像(task-fMRI)测量大脑活动的方法(如情景记忆、执行控制)的测试重测可靠性较低,因此,在目前的状态下,它们不能作为临床生物标志物。类似研究的结果也表明,其他广泛使用的功能磁共振成像测量方法的可靠性较低,包括短扫描产生的功能连接测量。幸运的是,提高可靠性的方法已经在心理学的相关领域(例如,人格或认知评估)发展和应用了很长时间。然而,这些方法在fMRI研究中尚未得到充分的应用。
在这篇综述中,我们开始描述历史趋势,促成了广泛的在个体差异研究中使用不可靠的fMRI测量。然后,我们强调了四种新兴策略(扩展聚合、可靠性建模、ME-fMRI和刺激设计),每一种策略都源于心理测量学,可以使研究人员可靠地测量大脑功能的个体差异(图1,关键图)。我们的结论是,尽管有一些错误的开始和死胡同,但使用fMRI积累、转化的个体差异的神经科学有一个光明的未来,但为了实现这个未来,我们必须颠覆现状的方法,支持心理测量学健全的原则,以促进测量的发展。
图1 一个典型的fMRI研究通过平均时间(通常是5 - 10分钟的数据)来测量激活或功能连接
2. fMRI个体差异研究简史
1992年3月,Kwong等人和Ogawa等人先后报道了第一批利用MRI绘制人脑功能的研究。在每一项研究中,通过实施受试者内部设计来对比交替的黑暗和视觉刺激之间的活动,使用血氧水平依赖(BOLD)信号来测量视觉皮层的活动模式。这些简单而强大的实验证明了功能磁共振成像(fMRI)在非侵入性测量人类大脑活动方面的潜力,并引发了一系列进一步研究人类大脑功能的热潮。
fMRI的第一个十年始于一个技术触发器,随后是迭代开发、广泛采用和对fMRI转化为我们理解和治疗从抑郁症、精神分裂症到阿尔茨海默病的进步的期望(图2)。
在第二个十年里,功能磁共振成像在广度和深度上都有所扩展。更强大的扫描仪以更大的空间和时间分辨率提供了大脑活动的测量。同时,功能磁共振成像越来越多地用于特殊人群的研究(如儿童、大脑障碍)。
正是在这一扩展阶段,一些研究人员开始采用功能磁共振成像任务,该任务最初是为了激发受试者内部的强大效应而开发的,以探索受试者之间的个体差异。
在2010年代,两个新兴趋势同时吸引了更多的关注和审视功能磁共振成像。首先,在fMRI成熟和前景的推动下,大型联合研究(如人类连接体项目,英国生物银行的建立,明确的目标是使用实验认知神经科学的fMRI任务来测量大脑功能的个体差异。其次,在心理学中不断出现的复制危机中,一波研究发现了主流功能磁共振成像实践的关键局限性,对许多个体差异的发现提出了质疑。
这些观察已经激发了方法创新,直接解决了许多这些限制,包括更精确的统计推断方法、更大的样本、提高可靠性的多元建模、运动审查和先进的数据处理技术。然而,依赖短扫描(即5-10分钟)在小样本(n≤100 )以及刚性刺激控制和组平均继续限制功能磁共振成像的能力可靠地测量大脑功能的个体差异,代表可转化的和易于操作的机制风险、病理生理学和治疗反应。即使有先进的方法来减少伪影和统计推断,常用的fMRI方法往往产生不可靠的测量。因此,这种不可靠性继续代表着对我们实现个体差异的严格的转译神经科学能力的根本威胁。鉴于可靠性是有效的个体差异研究的最低、必要的先决条件,越来越多的fMRI研究人员试图通过提出一个基本问题来建立一个新的转化神经科学框架: 在什么条件下,功能磁共振成像才能产生可靠的、针对个体的大脑功能测量,并足够精确地告知临床实践? 接下来,我们将重点介绍四个互补的策略,这四个策略是为了回答这个问题而出现的,以及这些策略背后的心理测量原理。
图2 fMRI研究的时间线
3. 建立可靠的个体差异的神经科学
3.1 通过扩展聚合提高可靠性
BOLD信号被来自热、生理(如运动、呼吸)和其他非生理(如扫描仪漂移)源的噪声所包围,仅代表fMRI数据中很小的一部分,约为5-20%。
为了解决由可靠的个体差异驱动的BOLD方差子集的分离问题,越来越多的精密fMRI (pfMRI)研究采用了经典测试理论中可靠的原则:每个人收集更多的数据。随着评估长度的增加,可靠性倾向于增加,因为随机的、非结构化的错误分数的可变性有更多的机会来抵消自己。
当这种情况发生时,真实分数的变化构成了测量的更大的一部分,从而导致更高的可靠性。例如,单项目测量通常受到噪声和项目特定方差的支配,随着附加项目的添加和多个项目的综合得分的使用,这些方差抵消了自身。通常,在心理测量学中,评估长度指的是问卷或调查的项目数;然而,同样的原理也适用于fMRI扫描长度。在各种各样的队列、扫描仪和研究设计中,已经表明fMRI测量的可靠性随着扫描长度的增加而增加。为了说明这一点,将不同日子的多个扫描session的数据组合在一起时,可靠性的提高尤为明显,这表明,由于瞬态因素(如一天的时间、头部位置、清醒程度和扫描仪的影响)而产生的不必要的差异,往往掩盖了在短时间内,单一会话扫描测量中隐藏的稳定的个体差异。pfMRI研究通过收集少量受试者长时间的数据(图3),进一步证明了可靠的、个体特异性的信号存在于脑网络的空间组织及其时间结构和时间尺度中。此外,pfMRI有助于发现以前被组平均所掩盖的新的皮层网络,并开始走向临床应用,用于指导经颅磁刺激,检测创伤性脑损伤的恢复,以及个体特异性皮质重组的测量。
pfMRI的新发现表明,如果有足够的数据,特殊的功能组织可能是规则,而不是例外。这表明传统的短fMRI扫描和群体平均的使用阻碍了许多转化神经科学的努力,因为个体差异被淹没在未知的变化和噪声的海洋之下。然而,目前的pfMRI方法需要从每个个体获取数小时的数据才能达到高水平的精度。在转化神经科学的许多解剖靶点(如杏仁核、伏隔核、眶额皮质)中,信号dropout混合不可靠,需要更多的数据。因此,对于大多数发育和临床样本来说,pfMRI的参与者负担是很高的,对他们来说,一动不动地躺在扫描仪中几个小时是特别具有挑战性的。因此,在目前的形式下,pfMRI尚未在人群神经科学领域得到广泛的研究,这对于实现fMRI广泛的转化价值至关重要。然而,到目前为止,pfMRI通过使用相对粗糙的方法,允许非结构化方差随着时间的推移而抵消,从而在很大程度上实现了更高的可靠性。以至于我们了解真正的分数变化的生成源,我们想测量(例如,BOLD信号)和错误的分数变化,我们想要删除(即噪声),替代策略用较短的扫描能更有效地实现精确和可靠的测量和降低参与者的负担。
图3 pMRI可以揭示可靠的、个体特异的脑功能特征
3.2 通过对稳定变异性进行建模,可以提高可靠性
转译神经科学研究的重点通常是测量稳定的疾病风险、状态和预后的生物标志物。然而,许多最广泛使用的fMRI建模方法通过将大量的fMRI测量降低到单个个体的平均估计值来混合稳定和瞬态变异。也就是说,功能磁共振成像研究经常将区域大脑功能减少到单一的激活或功能连接估计。例如,在任务功能磁共振成像(fMRI)中,这通常是通过拟合一个单一回归器或兴趣对比来完成的,该对比代表了控制条件和实验条件(例如,BOXCAR模型)之间任务的交替结构。类似地,功能连接性估计通常是通过将整个fMRI扫描的活动相关联而产生的。
这些建模方法最初是为实验认知神经科学设计的,其中,受试者间的方差是误差的来源,需要最小化,以最大限度地估计受试者内部的实验效果和组平均。然而,由于每个个体只有一个估计值(例如,任务对比beta或边缘功能连接),稳定的、个体特定的方差不能与主体内部方差的瞬时来源(例如,思想、情绪状态或注意力的波动)和噪声分开。
最近的研究表明,通过使用为重复测量设计的工具(如潜变量和层次贝叶斯模型)显式隔离稳定方差,可以大大提高任务激活和功能连接测量的可靠性。关键的是,这些建模方法既可以应用于每个个体的多个扫描,也可以应用于只有一个扫描的情况。这是因为功能磁共振成像扫描在本质上包含了对大脑活动或连接的许多估计。例如,多重激活估计可以通过将回归量分别拟合到fMRI扫描的前半部分和后半部分来产生(即,分割分析),或者,在更细粒度的水平上,通过将独立回归量拟合到扫描中的每个试验中来产生。类似地,多个功能连接性估计可以通过将单个扫描分割成两半,从而产生两个功能连接性估计,或者,在极端情况下,通过对每个fMRI体积或数据点产生协方差估计。一旦对每个个体产生了多个估计,就可以使用重复测量建模的工具将fMRI方差的稳定成分从瞬时方差和噪声中分离出来。总的来说,这种建模已经被发现可以提高激活和功能连接测量的可靠性,特别是从短的fMRI扫描中,可提高高达60%的可靠性。此外,这些稳定成分表现出更高的遗传力和更大的行为关联,进一步提高了转化价值。
这些方法说明了一个可能看起来违反直觉的测量原则:将fMRI数据分解成多个噪声估计,可以在潜在变量水平上生成更可靠的测量结果,而不是通过简单的跨组成部分聚合来实现。
此外,这一见解与最近的结构MRI发现相一致,即多次、快速、低分辨率扫描可以产生比单一、更长、更高分辨率扫描更精确的大脑结构估计(如皮层厚度)。然而,需要注意的是,这种可靠性建模并不是万能的,也不能取代仔细的测量。在其最简单的形式中,这种建模将通过设计吸收所有形式的稳定方差,包括稳定伪像,如头部运动、呼吸和血管动力学。因此,在建模过程中,这些生理假象被不完全去除的程度,它们也会被稳定成分吸收,并继续破坏大脑行为关联的有效性。
3.3 稳定性可以通过去除生理伪迹来提高
非bold变异性来源,如头部运动,通常是个体的稳定特征。因此,这些来源并不一定会通过聚合或潜变量建模被删除,因为它们的方差是非随机的,并且在不知不觉中模拟了兴趣的个体差异。此外,主流的数据处理技术往往不能完全去除这些生理伪影。ME-fMRI是一种新兴的、基于生物物理学原理的方法,可以从fMRI数据中分离和去除噪声和非bold源的方差。为了做到这一点,ME-fMRI在每个激励脉冲期间采集多个全脑图像(即多个回波),而不是通常采集的单个图像(即单个回波)。这允许去除许多生理伪像,因为BOLD信号会随着回声衰减,而非BOLD伪像和噪声则不会。
然而,ME-fMRI仍然需要谨慎的数据清理实践,因为在非神经BOLD效应(例如,整个扫描过程中的呼吸模式)中稳定的个体差异仍然会干扰个体差异研究。
3.4 可靠性可通过设计刺激来诱发个体差异来提高
如前所述,绝大多数功能磁共振成像任务的设计是为了实验操作受试者内部,群体平均效应,而不是最佳地唤起受试者之间大脑功能的个体差异。因此,提高fMRI测量个体差异的另一个策略是,从头开始设计新的任务,明确的目标是优化可靠性和精度。特别是,从项目反应理论和概括性理论中采用心理测量工具,根据刺激唤起可靠个体差异的能力来选择刺激,这在很大程度上是一个尚未开发的机会。毫无疑问,从头开始构建新的任务和刺激需要花费大量时间和昂贵的fMRI试点研究,以评估大量的刺激和任务项目,测试他们的心理特征,并反复选择刺激,有效地产生最精确、可靠的测量。然而,相关的研究表明,经过验证的具有已知测量特性的fMRI刺激可以产生巨大的好处,包括能够创建更完整的模型,来研究个体大脑如何处理感觉、记忆和语言信息。此外,初步证据表明,一小部分fMRI时间点不成比例地驱动了功能连接的可靠个体差异。由于这些高可靠性的时间点往往是由个体中相同的电影片段引起的,通过选择最有效地唤起大脑功能个体差异的刺激,可能会获得较大的效率收益。
自然主义的刺激,如电影、演讲和复杂的社会场景,可能在这方面有特殊的好处,因为它们使参与者保持参与、清醒和相对静止,从而减少由于头部运动、注意力和清醒而产生的伪迹。自然主义刺激也往往比传统任务具有更高的生态效度,可以很容易地针对各种各样的内容,包括视觉、情感和社会特征,目标是兴趣的心理构造。然而,这些好处也伴随着权衡。例如,自然主义刺激的复杂性通常不能很容易地控制到传统认知神经科学刺激的水平(例如,颜色组成,空间频率)。
4. 总结
我们在这里强调的策略并不是详尽无遗或规定性的。相反,通过强调这些策略以及它们在心理测量原理上的基础,我们希望促进功能磁共振成像研究的设计,使其能够更好地产生可靠的大脑功能个体差异的测量方法。使用fMRI的转化神经科学不能成为实验认知神经科学的次要目标,而是需要迭代的、明确的发展来优化可靠的个体特异性变异的测量。尽管最近出现了一些挫折,但鉴于现在我们比以往任何时候都更了解当前fMRI测量的局限性,并有新的策略来建立更精确、可靠的测量方法,我们看到了个体差异累积转化神经科学的光明前景。
网友评论