数据集:BraTS 2017,BraTS 2018,BraTS 2019
1. INTRODUCTION
脑肿瘤是由人脑中的异常细胞生长引起的。目前恶性脑瘤的发病率相对较高,对人类和社会产生了巨大影响[1]。最常见的恶性脑肿瘤是胶质瘤,可进一步分为高等级胶质瘤(HGG)和低等级胶质瘤(LGG)。磁共振成像(MRI)是一种典型的非侵入性成像技术,可以产生高质量的脑部图像,没有损伤和颅骨伪影,同时提供更全面的脑肿瘤信息,被认为是诊断和治疗脑肿瘤的主要技术手段[2]。在多模态脑图像的帮助下,医生可以对脑肿瘤进行定量分析,以测量脑部病变的最大直径、体积和数量,从而为患者制定最佳的诊断和治疗方案,量化脑肿瘤治疗前后的反应。综上所述,脑瘤分割是脑瘤诊断和治疗的关键步骤[3]。由于临床应用和科学研究的需要,脑瘤分割已成为医学影像领域的重要组成部分,长期以来一直受到广泛关注[4]。
近年来,以AlexNet[5]、VGGNet[6]、ResNet[7]和DenseNet[8]为代表的深度神经网络模型已被成功运用到各种计算视觉任务中,受到学术界和工业界的广泛关注。鉴于深度神经网络显示出强大的自动提取高判别特征的能力,它们被迅速应用于医学图像处理和分析领域[9]-[11]。同时,基于深度学习的核磁共振脑瘤计算机辅助诊断也受到了广泛关注。特别是2012年以来,与国际医学影像计算和计算机辅助干预协会(MICCAI)联合举办的多模态脑瘤分割挑战赛(BraTS)[3],极大地促进了基于深度学习的脑瘤分割方法的发展。一般来说,目前基于深度学习的脑瘤分割方法主要包括两种典型类型,即基于卷积神经网络(CNN)的方法和基于全卷积网络(FCN)的方法。基于CNN的脑肿瘤分割网络利用小尺度图像中的斑块分类思想来分割脑肿瘤图像。Pereira等人[12]在VGGNet的基础上探索了一个小型的3×3卷积核模型,构建了一个自动分割网络,该网络在BraTS 2013挑战赛中赢得了第一名。Havaei等人[13]构建了一个双路径的2D CNN脑肿瘤分割网络,通过采用不同大小的卷积核来提取不同的背景特征信息,该网络包含局部和全局路径。然而,补丁研究架构缺乏空间连续性,需要大量的存储空间,导致效率低下。基于编码和解码的概念,基于FCN的脑肿瘤分割网络对整个脑图像中的每个像素进行分类和预测,从而完成分割,这显然提高了脑肿瘤的分割效率。FCN[14]是一个端到端的语义分割模型,利用全卷积来解决逐像素预测的问题,是图像语义分割任务的一个重要里程碑。基于FCN的结构,Ronnebergeret等人[15]提出了一个称为U-Net的对称全卷积网络,该网络已被广泛用于各种医学图像分割任务。U-Net包含一个捕捉上下文信息的收缩路径和一个确保准确定位的扩展路径,极大地提高了医学图像分割任务的性能。研究人员还将基于U-Net的架构引入到脑瘤分割领域。Donget al.[16]开发了一个基于U-Net的二维分割网络,并采用实时数据增强来完善脑肿瘤的分割性能。Konget等[17]在U-Net结构中引入特征金字塔模块,整合多尺度语义和位置信息,有效地提高了分割精度。为了进一步提高性能,在脑瘤分割网络中还引入了密集区块、扩张卷积、多分辨率区块和上跳连接[18]-[21]。
此外,注意力机制在人类感知中起着重要作用,它可以有效地突出有用的信息,而抑制多余的信息。最近,注意力机制在多种计算机任务中受到广泛关注,如计算机视觉领域的自然语言处理[22], [23], 自然图像分类[24]-[26], 突出对象检测[27], [28], 自然图像分割[29]-[33]和视频对象分割[34],以及医学图像分析领域的医学图像分类[35], [36] 和医学图像分割[37]-[41] 。有许多尝试将注意力模块嵌入到深度神经网络工作架构中,以提高图像分类和图像分割的性能。Wanget al.[25]建立了一个剩余注意力网络,从不同的模块中产生注意力感知特征,这些特征会随着攻击者的深入而自适应地改变,并有效地提高分类的准确性。Huet al.[26]提出了一个关注通道和激励(Squeeze-and-Excitation,SE)块的注意力模块,该模块关注通道关系,并执行动态通道明智的特征校准,以提高特征表达。Liet al.[32]和Yuet al.[33]将具有较强语义的深层特征送入类似SE的注意模块,以提供高层次的类别信息,这有助于在图像分割的上采样阶段精确恢复细节。Wanget al.[42]首先提出了一个开创性的非局部神经网络(NL-Nets)系列,通过将特定于查询的全局上下文聚合到每个查询位置来捕捉长距离的依赖性,这也被迅速应用于图像分割任务中。Zhaoet al.[29]设计了基于NL-Nets[42]的非局部操作的位置敏感模块,以获得上下文的长距离依赖性,这在几个竞争性的场景解析数据集上取得了令人印象深刻的分割结果。Zhang等人[30]利用先验分布来扩展非局部模块,并构建了一个具有权重的非局部操作集合,以追求更好的分割性能。Fuet al.[31]采用由空间注意和通道注意组成的双注意模块进行语义分割,其中注意模块类似于非局部操作。同时,注意机制也逐渐被引入到医学图像分割领域。Oktayet等[37]提出了注意力模块,使注意力系数对局部区域更有针对性,在胰腺分割中取得了良好的效果。Qiet al.[40]设计了一个非局部的操作,称为特征相似性模块,以捕捉长距离的依赖关系,为脑卒中病变分割问题提供更有效的上下文信息。此外,Zhang等人[43]在一个改进的全卷积网络中引入了由区域注意、空间注意和通道注意组成的多个注意模块,在脑室分割领域取得了卓越的表现。
U-Net在医学图像分割领域取得了巨大成功,也是目前MRI脑肿瘤分割方法的主流。然而,在降采样的过程中,U-Net不断缩小图像的尺寸,导致对小尺寸肿瘤的分割精度不高。我们注意到,脑瘤具有复杂的形状和不同的大小,导致在脑瘤分割任务中存在着小尺度的肿瘤。考虑到注意力机制可以增强局部特征的表达,为了解决U-Net对小尺度肿瘤的分割精度不高的问题,我们旨在探索注意力门(一种用于图像分割任务的高效注意力模块[37])对脑瘤分割问题的有效性,并针对这一任务提出了一种新型的注意力门剩余U-Net模型,即AGResU-Net。在三个脑瘤分割基准上的实验结果表明,注意力门对脑瘤分割任务是有益的。本文的主要贡献归纳为三个方面。(1) 我们为MRI脑肿瘤分割任务提出了一个端到端的AGResU-Net模型,其结构如图I所示。AGResU-Net不仅提取了更丰富的语义信息,而且更关注小尺度的脑瘤信息,从而提高了脑瘤的分割效果。(2)AGResU-Net将残余模块和注意力门整合在一个原始的、单一的U-Net结构中,其中一系列注意力门单元被添加到跳过连接中,用于突出突出的特征信息,同时对不相关的和噪声的特征反应进行区分。一方面,残余模块增强了特征提取和表达的能力,并有助于在下采样过程中进行分类。另一方面,注意力模块对小规模肿瘤给予了更多的关注,获得了更多的小规模肿瘤的位置信息,从而使上采样过程有助于恢复小规模肿瘤的位置信息。(3) 我们在BraTS 2017、BraTS 2018和BraTS 2019三个脑肿瘤分割基准上对AGResU-Net进行了广泛的评估。此外,我们还进行了将注意力门嵌入基本U-Net模型的实验。实验结果表明,带有注意力门单元的模型,即注意力门U-Net(AGU-Net)和AGResU-Net,分别优于它们的基线U-Net和ResU-Net。此外,AGResU-Net取得了比典型的脑瘤分割方法更有竞争力的性能。
网友评论