摘要
对于EEG数据有多种分析方法来评估大脑连通性。然而,连通性方法的实施存在很大的异质性。连通性测量、数据收集或者数据预处理的概念化的异质性可能与测量稳健程度的易变性有关。虽然使用不同EEG连通性测量的研究之间很难进行比较,但标准化的处理和报告可能有助于解决这个问题。本文讨论了重参考、epoch的长度和数量、容积传导的控制、伪迹去除、多重比较的统计控制等因素如何影响连通性测量的EEG连通性评估。基于先前的研究,本文提出了相关建议和新的检查清单用于EEG连通性研究的质量评估。该检查清单和建议旨在提请注意那些可能影响连通性评估的因素以及未来研究中需要改进的因素。EEG连通性程序和报告的标准化可能使得EEG连通性研究更具可综合性[如,用于元分析研究]和可比性,尽管连通性评估的方法上存在差异。
人类的大脑是一个功能上互相连通的网络,其连通性或同步性活动被认为是行为、认知和情绪状态的基础。EEG是一种低成本的工具,可以以高时间分辨率来测量大脑的电活动。EEG活动会产生振荡,电压值会从负到正,再从正到负。可以从时域、频域或时频域来解释这些振荡。通常,EEG信号分为5个频带:delta、theta、alpha、beta和gamma,对每个频带都可以评估其功率谱和峰值功率。
EEG连通性包括两个或多个EEG电极点上的信号之间的统计上显著的同步性。有多种方法可以进行EEG连通性分析。1)有效连接:这种方法试图确定从一个电极到另一个电极信息传递的因果关系。即,如果一个脑区在时间上先于另一个脑区激活。2)功能连接:这是双向连接,不能确定因果关系。即,两个脑区共享同一个活动,表明这两个脑区是相连的。功能连接运用的更频繁,可能是因为公认这是一种统计上更加稳健的测量方法。
而且,连通性可以评估静息状态下的(没有参与任何任务导向的认知活动),也可以评估执行特定认知任务状态下的(任务相关的连通性)。通过EEG评估任务相关的连通性存在一些额外的独特的挑战(见下文)。
目前有很多不同的EEG连通性分析方法。Wang等人确定了42种计算EEG连通性的方法,并且还有更多的方法还在开放当中。方法的多变性使得难以可靠地比较使用不同方法的研究之间的差异。由于计算EEG连通性之前的EEG数据采集和处理步骤缺乏标准化,使得上述的比较变得更加复杂。越来越多的研究表明,EEG数据分析中不适当的步骤会导致连通性指标的偏差和假阳性率的增高。而且,目前并不存在一种最佳方法可以用来评估EEG连通性。
基于现有文献,为优化EEG连通性的测量有必要采用以下分析步骤/参数:1)有效去除伪迹;2)控制容积传导;3)重参考;4)epoch的参数(包括epoch的长度和数量);5)使用网络分析方法。除了这五个步骤之外,还必须考虑相应的统计方法以及统计方法的前提假设。
目前发表的研究中,对上述分析参数的控制和报告并没有形成一致。因此,本指南和检查清单的目的是在进行EEG连通性相关研究之前提供方法上的指导,以及评估连通性研究质量和解释连通性研究结果时的要点。这篇综述中主要关注静息态EEG连通性的指标,因为这些被研究的最多,而任务相关的连通性存在一些限制,这些限制可能会影响到最优连通性评估。认知任务期间的连通性可能会在认知过程中随着时间动态调整,这反过来会影响连通性、分析参数的选择(即,epoch的长度)和连通性评估。因此,任务相关的连通性评估仍然是次优的。这不是说不应该评估任务相关的连通性,而是说在研究和开发出更加优化的方法之前,应该谨慎评估任务相关的连通性。关于EEG连通性研究需要考虑的各种细节,请见图1和补充材料D中的Checklist Scoring Guidelines。
图1.EEG连通性研究质量检查清单。评分质量等级见表1。CAR(共同平均参考,common average reference);QR(质量评级,quality rating);rCAR(稳健的共同平均参考,robust CAR);REST(参考电极标准化技术,reference electrode standardization technique);stats(统计,statistics)。
伪迹去除
EEG采集的数据是组合数据,包括有用的大脑相关信息和与大脑无关的伪迹(例如,眨眼、头部肌肉活动和电频干扰产生的电位)。当伪迹的影响同时被两个电极记录到,两个电极可能产生虚假过高的连通性的评估。因此,在伪迹最少的EEG数据上评估EEG连通性至关重要。减少伪迹的方法在EEG研究中很常见:补充材料B提供了相应的技术和推荐的方法。
总的来说,建议研究人员提供一份关于伪迹去除和每种伪迹控制的详细说明。推荐的方法:在保持超过约60%信号的同时尽可能多的去除伪迹噪音。应优先使用标准化的自动伪迹去除过程以增加研究之间清洗数据过程的可比性,而不是使用人工去除伪迹,因为人工去伪迹容易导致研究人员之间以及研究之间的可变性。最后,文献表明应谨慎使用独立成分分析(ICA)去伪迹,首选其他替代性的去伪迹方法(例如,wavelet-enhanced independent component analysis)。有关具体细节和检查清单评估,请参见图1和检查清单评分见补充材料D。
容积传导(VC)
容积传导(Volume conduction, VC)指电流几乎瞬时通过脑组织和头部其他物质进行传导的现象。因此,一个源的活动(由某个脑区产生的活动或者与大脑无关的EEG伪迹)可以被多个电极检测到,而且没有相位延迟。仿真研究表明,不存在真实连通性的非同步性的源会在头皮层面影响同步性测量,从而产生虚假连接。确实,头皮空间EEG连通性的假阳性率较高,而且仿真研究发现头皮空间连通性模式可以在没有任何实际源连通性的情况下得到复制。
研究人员通常通过估计源空间数据的连通性来控制VC的影响。源空间连通性评估排除了大脑中评估的源的外部的数据的影响,因此瞬时传导对连通性评估的影响降到了最小。然而,源空间模型所依赖的假设在数据中无法直接进行测试,并且有可能丢失了恢复源的精确时间进程;因此,虽然源空间连通性或许可以解决VC的问题,但它并不明显优于头皮空间分析(补充材料B)。而且,研究表明源空间连通性分析并不能完全消除VC的影响。
一个备选方法是,基于特定参数的头皮空间方法可以避免潜在的VC混淆;与源空间方法相比他们包含更少的假设。EEG数据的一些特征可以指示头皮空间数据中是否存在VC(补充材料B),控制头皮空间VC有几种方法:使用滞后测量来计算连通性;空间滤波。
滞后连通性包括排除零相位延迟交互的可能影响。零相位延迟交互是两对电极同时发生的相位变化,这是VC的特征。在神经信号传导时间已知(非零)的情况下,大脑中的直接连接产生零相位交互在生理上是不可信的。然而,间接连接也是可能的,间接连接中两个脑区由于连接到这两个脑区的第三个脑区的因果连接而表现出电流的瞬时变化。因此,我们建议使用减少零相位对结果影响的连通性分析方法。
另外,空间滤波可用于解释VC的影响,例如,表面拉普拉斯基于头皮空间记录的数据估计头皮的径向电流。这种方法减少了VC对相干的评估和基于相位的连通性的评估的影响。相比之下,拉普拉斯从每个电极的远距离源中移除了共有的数据,只保留了电极附近的表明活动,因此,如果重点关注远距离脑区之间的同步,那么头皮空间数据的分析可能是合理的。
总之,文献表明,源空间连通性可以为分析提供多种益处,尤其是在主要研究问题是围绕识别连通性的形状和理解脑区连通性的情况下。然而,使用相位滞后或者表面拉普拉斯等方法控制VC来评估头皮空间连通性也是可靠和有效的。
重参考
在EEG中,电压是两个电极之间的电位差。通常是分布于头皮上的所有电极和一个参考电极之间的电位差值。由于电压测量依赖于参考电极,所以参考电极处检测到的活动会影响其他电极处测量的信号。因此,理想情况下参考电极应该为电中性。实际上,在记录过程是不可能的;因此,记录的信号通常要进行离线重参考来减少信号污染。
目前的几种重参考技术都会对连通性评估造成不同程度的偏差。包括1)单电极参考:所有电极都以相同或者公共的电极进行重参考;2)乳突参考:左耳和右耳耳后采集到的信号的平均值;3)共同平均参考(CAR):计算所有记录电极的平均激活,再从每个电极上减去这个平均值;4)稳健的共同平均参考(rCAR):使用鲁棒性最大似然估计对CAR的改进;5)参考电极标准化技术(REST):使用等效分布式源模型在数学上重建EEG数据,使数据以无限远点为参考电极进行离线重参考,这个点被认为使理想的中性参考电极点。
单电极参考和乳突参考已被证明会产生最大的失真,CAR和REST则产生较少的EEG信号失真。仿真EEG研究发现可以使用鲁棒性最大似然估计改进CAR,即rCAR,该技术性能要优于其他技术。Qin等人还发现,评估相干时,REST要优于其他技术(除了rCAR)。然而,Lepage等人则发现rCAR要优于REST。
需要注意的是,CAR和REST并非完全没有限制。主要的限制在于,当头皮电极分布不足时不能使用这两种技术。这对REST尤为重要。因此,考虑进行连通性分析时,使用REST重参考技术电极数不能少于32个。这可能也适用于CAR和rCAR,因为这两种技术都基于这样的观念:更多的电极代表对大脑更好地采样,因此平均电位接近于零。
最后,表面拉普拉斯是一种无参考的技术,这种技术可以提高功能连接评估的准确性,特别是基于相位的指标。在连通性研究中,表面拉普拉斯在VC伪迹消除方面优于CAR。鉴于在评估头皮空间连通性时假阳性增加,表面拉普拉斯可能会减轻这些混淆,并使头皮空间的估计更加稳健,因为它考虑了VC的影响,并且基于比源定位技术更少的假设。总体而言,REST,rCAR和表面拉普拉斯(尤其是对于头皮空间连通性)似乎是最稳健的重参考技术。
Epoch长度和数量
EEG连通性评估会受到分析数据的长度(segments或者epochs)的显著影响。如果分析的EEG epoch短于记录电极相互作用的时长,由于频谱估计不可靠可能会导致结果有偏差(特别是对于低频慢波影响更大)。较短的epoch可能难以评估整个连通性交互,所以可能在实际有连通性的情况下评估却认为不存在潜在的连通性。研究表明,更长的epoch可以更稳定的评估连通性。Fraschini等人发现,在各种连通性指标上至少需要4s的epoch才能达到稳定性;对于振幅包络相关最好需要6s,对于相滞指数最好需要12s。
研究还表明,基于较少数量的epoch进行连通性评估会导致结果的假阳性。在两个或多个条件进行比较的情况下,不同条件下的epoch数量不等时尤其如此。少于100个epoch的连通性估计会高估在相干、格兰杰因果和锁相值指标上的连通性,这表明较少的epoch会增加连通性评估的偏差。
即使对于较短的epoch,增加epoch的数量也可以减少伪连接。静息态的研究已经证明了这一点,在静息态研究中无伪迹的较长epoch是不太现实的,Haartsen等人的研究表明,对于较短的epoch,增加epoch数量提高了连通性评估的可靠性。然而,这些结果只局限于alpha频段,不同频段的连通性和epoch长度的交互作用可能不同。
也存在这样的可能性:对于较快的频段较短的epoch更可靠,而对于较慢的频段较长的epoch更可靠。这源自于这样一种情况:对于较快的频段,较短的时间窗就可以捕获足够的振荡周期以用于比较,而对于较低的频段,较短的时间窗内捕获的振荡周期会更少。
在评估任务相关的EEG连通性的研究中,由于不太可能使用较长的epoch,因此了解epoch的数量和长度的限制非常重要。根据任务的不同,每个刺激会以小于2s的时间间隔呈现给被试。如果更长的epoch能够更好地用于评估连通性,并且该标准适用于任务相关的EEG连通性评估,这可能意味着连通性评估估计多个不同大脑加工的连通性,因为在认知加工过程中潜在的连通性可能在相对较短的时间尺度上发生变化。因此,如果特定的认知任务相关的加工仅在任务刺激后短时间内发生,则可能会忽略其对连通性的影响。在可能的情况下,建议设计的认知任务要能提取较长的epoch。如果不行,则加入更多的epoch来提高连通性评估的可靠性。根据现有研究,我们初步建议对于长度≤2s的epoch,其数量不少于50试次。
总之,评估静息态和任务相关的连通性的研究需要给出epoch长度和数量的具体的理由。这意味着要考虑潜在的大脑加工过程;兴趣的频段;使用的连通性评估;对于任务相关的研究还需要考虑使用的特定的认知任务的参数。一般而言,在更稳健的研究出现之前,对于基于相位的连通性指标4-6s的epoch是最佳选择。
虽然目前的研究没有提供方法来规避任务相关的连通性评估中提出的具体问题,但仍可以给出一些建议。如果使用较短的epoch,建议分析的epoch数量不少于50段。要基于以前的研究给出确定epoch长度的明确的理由,理想情况下有理由去参考被评估的特定条件、障碍或者认知任务的潜在的大脑加工过程(即,关注任务中预期会调节连通性的时间段)。
网络理论与地形图
进行EEG连通性分析的一个重要选项是使用网络理论进行地形图绘制。网络理论是图论的一种应用形式,图论是用于构建/建模连接的框架,以评估脑区、节点或者EEG电极之间的连通性模式。非网络方法仅仅检查特定电极对的连通性数值,但不评估每个电极对如何连接到更大的网络中。相反,网络度量使用多变量分析(相比于非网络EEG连通性评估中使用双变量分析)来识别较大电极集合中的连接。
然而,网络度量中的多变量分析非常复杂,而且EEG研究通常使用多种技术获取双变量连接并将其应用到网络度量中。在这些分析方法中,需要设置阈限值来确定是否存在连通性。基于该阈限值,将估计值进行二值化或分成两组:0表示电极对之间不存在连通性,1表示电极对之间存在连通性。一般而言,要避免采用包含武断的或主观的阈限设置,因为这可能会导致数据分析的问题;也就是说,研究之间的武断的阈限可能不同,最终产生不同的结果,即使它们使用的相同的指标。如果某个研究的某些连接不满足该研究设定的阈限,则它不会被纳入网络中,而如果另一个研究中设定了更高的或者更低的阈限,那么它的结果则分别会显示更多或更少的显著链接,这将影响两项研究之间比较的结果和可靠性。
此外,由于阈限值根据数据的分布而变化,因此阈限设置要基于数据本身但也独立于条件之间的对比,这点非常重要。我们强烈建议不要用数值定义阈限,而是基于密度(密度指数据中存在的连接的数量与可能存在的总的连接数量相比较)定义,因为图的密度严重影响结果,最小生成树和效率成本优化等技术能够解决网络密度的问题。此外,使用对连接进行加权的数据驱动的分析是另一个可接受的备选方案;其中,权重是基于连接各自的强度。因此,连接越强在网络中的权重越大,越弱的连接权重越小,但所有连接都纳入最终的分析中。如果不能设置非武断的阈限,建议评估多个阈限并全部报告。理想情况下,所有测试的阈限都应预注册,以避免可能出现的故意寻求阳性结果。
最后,对网络设置阈限以及二值化,目的是为了给后续分析准备好数据。网络分析加深了对连接地形图的理解并且可以最大限度地减少一些统计上的限制,例如控制多重比较的问题(因为统计评估是在网络层面上进行的,而不是针对每个单独的连接)。然而,考虑到连接强度是一个连续变量,而网络分析只考虑电极/脑区之间的二元关系,因此网络分析可能无法准确表征具体的网络特性。所以,与大多数的处理和分析选择一样,在决定是否在连通性分析中使用网络理论之前,必须考虑研究目标、研究假设以及具体的研究问题。
总之,如果要在研究中使用网络指标,需要在数据分析之前提出明确的计划和理由。网络阈限不能武断设置,而应该使用客观的模型驱动的阈限。或者,如果研究人员不想忽略较低强度的连接,可以使用加权网络来理解整个网络。
统计学考量(要求)
连通性统计一个主要考虑因素是多重比较问题。鉴于可用于比较的电极对的数量随着可用于分析的电极数量的增加而增加,对于超过64个电极的电极帽,可用于比较的电极对数量会超过1000。如果对每对电极对进行实验组别间的统计比较并且不控制多重比较,那么这种数量的比较一定会导致假阳性。尽管有这样的风险,一些研究完全忽略了控制多重比较,另外一些研究则没能完全考虑多重比较。
控制多重比较的常用方法包括Bonferroni校正和错误发现率(FDR)。然而,这两种方法中校正的p值会大大降低统计效力,导致过于严格的p值阈限,这可能会隐藏了真实的效应。在几乎所有的功能连接分析中,这些测试无法充分说明实际的比较数据,并且Bonferroni校正的独立统计测试假设过于严苛。EEG数据是相关的和多维的,所以不同电极对的功能连接值不是独立的。
解决连通性分析中大规模单变量比较检验(mass-univariate comparison testing)的问题,推荐使用非参数置换检验。非参数置换检验不依赖于对检验统计量的理论分布的假设(正如参数检验那样),而是依赖于从现有的数据中创建的分布。这对于非正态分布的数据(EEG指标所具有的特征)也是有效的。置换检验不是对多重比较的控制,但它可以容易地整合对多重比较的校正,给出对相关的多维数据较为敏感的p值阈限,并且它是根据结果中的信息来校正p值而不是根据测试的数量。
非参数置换检验最常用的方法是使用连接的聚类的大小来确定阈限。该方法详细的介绍本文不作介绍。只需要注意,当非参数置换检验结合图论方法来确定阈限时,它们有助于避免建模的问题以及数据因偏态而产生的问题。非参数程序的一个例子是,基于网络的统计(network-based statistic, NBS),该方法基于这样一个假设:感兴趣的连接来自于成分,开发出该方法是专门用于提供比独立校正的p值更大的统计功效。当在包含图论或者连通性指标的每个连接上进行大规模单变量检验(mass-univariate testing)时,NBS控制了多重比较谬误(Familywise error rate)。
虽然NBS和基于聚类的校正很常用且是可行的,但是用于定义连接集的阈限往往不是数据驱动的,因此基于实现定义的主观的选择会导致不同的结果。我们推荐数据驱动的聚类阈限的方法;另外一些建议是这些方法可由数据的空间频率来定义。就连通性分析的有效性和适用性而言,作者建议在以下情况中使用非参数置换检验:数据非正态分布、使用基于图论的分析、数据驱动或探索性的分析而非假设驱动,以及评估的是多个网络的连接而非全网络的连接。
当使用非参数置换检验时,建议研究人员报告在非参数置换检验时,数据的什么属性被置换了,置换适合研究问题的关注点,迭代的次数,p值的构建(或为获取聚类,零假设使用的p值阈限),以及多重比较矫正的细节。最后,如果通过将分析限制在平均全脑连通性或数量较少的特定连接对上来控制多重比较,Bonferroni和FDR校正是比较合适。然而,如果关键的统计模型是大规模单变量检验(mass-univariate testing)时,非参数置换检验和聚类统计可能是最好的。
样本量大小考虑
作为最后的考虑,Larson和Carbine证明,在100项高影响,随机选择的EEG研究中,没有一篇报告了样本量选择的统计效力计算。预先计算达到统计效力的样本量非常重要,这能保证研究有足够的能力来检查所感兴趣的效应。这对研究的元分析检查也很重要。然而,许多研究开始时没有预先计算所需的样本量。
鉴于样本量效应、选择和分析中存在的差异,无法给出明确的标准或者建议。然而,作者鼓励研究人员需要更多地关注于报告和实施预先样本量计算,以及在出版时呈现这些信息和相关的统计,因为该步骤将大大提高未来EEG连通性研究的科学严谨性。出于这个原因,我们在检查清单中添加了一个双变量条目供研究人员参考。有关此问题的进一步具体讨论,请参阅补充材料C中源于样本量的内容。
EEG连通性研究质量检查表
总体而言,先前研究对最优EEG连通性分析的建议如下。应详细介绍伪迹去除的方法并考虑所有类型的伪迹。控制VC效应(例如,通过基于相位的指标,相位滞后,或者源定位技术)是获取精确的连通性评估重要的一步;在文章中详细报告控制VC的细节至关重要。而且,rCAR和REST是正确连通性识别最好的两种重参考的方法。与此同时,表面拉普拉斯可能是一种有前景的替代方法,该方法不需要重参考。对于静息态数据,epoch超过6s能够提供最佳的连通性评估。另外,epoch数量超过100段(并且在所有条件下epoch数量相等)能够减少连通性评估的偏差。最后,控制多重比较是必要的,使用客观的、基于模型的网络指标或者多个连通性评估可以提高连通性评估的可靠性和有效性。
在确定和说明了有关EEG连通性结果的解释和报告的问题和考虑因素后,我们试图开发一个新的检查清单,以便对EEG连通性研究进行质量评估和比较。该检查清单旨在指导未来的研究,确保EEG连通性研究高质量的研究设计。不幸的是,由于现有较多的分析技术,并且缺乏直接的比较证明一种技术优于另一种,因此现有的证据无法为所有步骤提供具体的建议。因此,该检查清单提供了关于哪些方法应该被认为足以产生高质量的EEG连通性研究的建议。在可能的情况下,我们提供了具体的建议,而在证据基础不能明确一个最佳解决方案时,我们提供了一系列的备选方案。因此,我们提出了图1中研究质量检查清单,用于评估和解释EEG连通性研究;检查清单上的每个条目都有注释,为评估内容提供了明确的指导。
这份检查清单可用于多种目的,包括1)提供研究人员在设计和报告他们的研究时应该考虑的关键信息,2)指出同行评审和期刊编辑应该评估和/或要求的信息,3)建议EEG连通性研究的读者应该严格评估的点。
该检查清单不是为了限制研究人员。相反,这是为了在评估EEG连通性的研究和未来研究潜在的改进领域时,提请注意可能存在的假阳性。该检查清单专门为了评估EEG连通性的研究和研究人员定制的,而非一般的EEG研究。
检查清单完整详细的评分指导在补充材料D: Checklist Scoring Guidelines中。检查清单可以根据表1中给的标准进行评分,其中研究被分为三类:高质量、中等质量或低质量。
需重点注意的是,应该使用定量评分,这样检查清单就更容易在定性框架(表1)中评分。在这个意义上,0表示“不推荐使用”,0.5表示“可以使用”,1表示“最佳使用方案”。定性指标不做这样的假设,例如,REST重参考比乳突重参考好两倍。这也并不意味着与没有多重比较控制的情况相比,使用乳突重参考同样容易出现假阳性。在特定情况下,不进行多重比较控制几乎一定会导致假阳性,而使用乳突参考可能导致假阳性风险小幅度增加。然而,为了提升研究人员的认识并促进最佳标准化实践,不鼓励使用标为0(即不推荐使用)的方法,因为这些方法增加了结果假阳性的可能性。
随着EEG连通性领域的不断发展以及更多的研究发表,可能需要考虑其他的标准将其加入到检查清单中。还可以考虑报告各电极对比较的p值,或者报告各对电极之间连接的平均数和标准差或者效应量(这些数值或检查清单参数可以在补充材料中报告)。这种方法将利于元分析方法的开发,例如fMRI领域的“激活似然性估计”(activation likelihood estimation,ALE)的元分析技术。
该检查清单及其建议旨在使EEG连通性研究的结果更具有可综合性。使用该检查清单还可以更好地量化EEG连通性研究的质量,以便进行元分析,这在元分析领域中是不可能的。由于评估EEG连通性研究质量的能力得到了提升,该检查清单可以对连通性相关的加工过程得出更可靠的结论。例如,我们或许可以更自信的回答下列问题:“脑区之间和/或频段之间的连接因不同的神经或心理健康障碍而受损的可能性有多大?”,或者“与特定认知功能相关的连通性增强的证据有多稳健,以及这与连通性变化有什么关系?”这些连通性相关的问题很有价值,值得严格评估。我们希望识别、解释和评估这些EEG连通性研究成分将有助于该领域回答这些重要问题。
参考文献:EEG-connectivity: A fundamental guide and checklist for optimal study design and evaluation. Biological Psychiatry: Cognitive Neuroscience and Neuroimaging.
网友评论