论文阅读_CBAM卷积网络中使用注意力模型

论文阅读_CBAM卷积网络中使用注意力模型

作者: xieyan0811 | 来源:发表于2020-05-06 11:30 被阅读0次

论文阅读_CBAM卷积网络中使用注意力模型
[Deep-Learning-with-Python]计算机视觉
【CV中的Attention机制】并联版的CBAM-BAM模块
task8
[论文笔记]Learning Versatile Filters
Grad-CAM 卷积网络中的热力图
7组-MobileNets: Efficient Convolu
菜鸟笔记之《Deeper Insights into Graph
注意力机制在CV领域的应用
CBAM: Convolutional Block Attent

论文地址：https://arxiv.org/pdf/1807.06521.pdf
代码地址：https://github.com/Jongchan/attention-module

《CBAM: Convolutional Block Attention Module》是2018年收录于cs.CV的一篇论文，文中提出在基础网络（如ResNet）的Block块中加入Attention机制的方法，以提升图片分类和目标检测效果。

之前改进图像模型的方法常常是加大网络的深度、宽度、基数（cardinality），这些都需要占用更多的资源，而CBAM引入的Attention注意力方法增加的开销非常小。

CBAM原理

注意力机制模仿人看物体时的方法：通过简单一瞥，分析图像的重要部分，然后聚焦于该位置，而不是对画面中所有区域给予同等重视。

CBAM通过之前提取到图像的feature map，在通道channel和空间spatial分别学习了What（注意什么）和Where（注意哪儿）的Attention map。基本原理如下所示：

Channel Attention Model

从卷积网络提取的特征一般是CxHxW，其中C为通道数，W和H分别为经过卷积后得到的缩小后的图片宽高，即Input Feature，将它作为输入。CBAM依次建立了1D的通道卷积层Cx1x1，和2D的空间卷积层1xHxW。公式如下：

其中⊗表示矩阵中对应元素相乘，类似对图像的mask操作，具体方法如下图所示：

在Channel Attention部分，将每一个Channel视为一种对图片的特征提取器（每个通道从图片中提取各类特征，如纹理，样式）。此处，把每一个通道中的HxW个小块通过最大池化和平均池化压缩成单块，将这两部分分别送入同一网络Mc分别计算，Mc是含有一个隐藏层的多层感知机MLP，隐藏层大小rx1x1，r通常小于通道数，引入它为了简化计算，否则，当通道数很大时，直接用全连接网络计算量太大，由此，上图中的Mc呈漏斗形。

Mc计算公式如下：

其中σ表示sigmoid函数，W1和W0分别是MLP的两层，中间夹着隐藏层h和ReLU激活函数（c->h,h->c）。通过训练，学习到参数W1和W0。

Spatial attention module

空间层用于提取内部空间的关系，计算哪一小块应该被重点关注，该层的输入是经过Channel Attention处理的数据，同样也使用了两种池化方法，分别将多个通道的值压缩到单个通道，在Spatial层经过7x7的2维卷积，计算得到对空间的加权，具体方法如下式所示。

其中σ表示sigmoid函数，f为卷积层处理（由卷积、归一化、ReLU组成）。

与CNN网络结合

下图展示了CBAM与ResNet结合的一种方式（也可以根据不同的需求加在不同位置）。

它在Block层与ResNet相结合，注意此处将Attention加入到每一个Block里面，而不是只加在最后，CBAM也由此得名：Convolutional Block Attention Module卷积块中的注意力模型。

模型效果

对ResNet50模型分别加入了AvgPool和AvgPool后，模型大小几乎没有变化，同时可以看到模型效果的提高，下表展示了加入Channel Attention后的效果：

其中AvgPool提取平均特征，MaxPool提取了显著特征，相互结合效果最好，由于它们提取的都是同种特征，因此使用了同一网络。

使用了Spatial Attention后模型效果对比如下图所示：

Channel提取的特征相对全局化，Spatial提取的特征相对局部，Channel和Spatial模块分开处理比合并处理效果更好，处理的先后顺序理论上可以互换，实验效果是Channel放在前面效果更好一些。从下图可以看到不同组合的效果。

除了提升现有模型的能力，CBAM也增强了模型对特征的提取能力，使用Grad-CAM工具分析最后一个卷积层的输出，可以看到在目标识别任务中，不同模型标识的不同重点区域，从p值可以看到，CBAM有明显的优势：

把CBAM插入到基础网络中，目标识别效果也有提高，且性能几乎不受影响。下表展示了在COCO数据集上目标识别的提升效果。

源码

从源码中可以看到Attention层在图像处理中的具体用法：先加入Attention层的计算，然后将Attention与原有特征x进行元素相乘。BCAM的核心代码不过百行，下面摘录了其Spatial Attention部分：

其最后两行，先用sigmoid计算类似门控的值，用于过滤重要部分和次要部分，然后与具体特征数据x相乘即可，非常简单直接。该部分的完整代码请见：

https://github.com/Jongchan/attention-module/blob/master/MODELS/cbam.py

以此方式，无论是使用从图片中提取的信息作为Attention，还是使用其它额外信息作为Attention加强对图片描述都非常方便。

相关文章

论文阅读_CBAM卷积网络中使用注意力模型
论文地址：https://arxiv.org/pdf/1807.06521.pdf代码地址：https://git...
[Deep-Learning-with-Python]计算机视觉
包括：理解卷积神经网络使用数据增强缓解过拟合使用预训练卷积网络做特征提取微调预训练网络模型可视化卷积网络...
【CV中的Attention机制】并联版的CBAM-BAM模块
前言：之前介绍了CBAM模块，可以方便的添加到自己的网络模型中，代码比较简单容易理解。CBAM模块的实现是通过先后...
task8
文本分类使用双向循环神经网络使用卷积神经网络->TextCNN TextCNN 模型主要使用了一维卷积层和时序...
[论文笔记]Learning Versatile Filters
一句话介绍：使用多用卷积核构建轻量网络模型优势：不改变原来的网络结构，只需要换一下卷积的接口论文地址开源代码原作者...
Grad-CAM 卷积网络中的热力图
github地址论文地址使用Grad-CAM 对卷积网络中的特征图进行加权求和，得到卷积conv5的热力图，这种可...
7组-MobileNets: Efficient Convolu
主要贡献提出MobileNets模型，该模型使用depthwise separable卷积构建轻量级网络，可用于...
菜鸟笔记之《Deeper Insights into Graph
这篇论文是关于图卷积网络应用在半监督学习方面的深度见解，图卷积网络的理解提供了独特的视角，同时在原始模型的...
注意力机制在CV领域的应用
注意力机制在卷积网络的优化中，以及被广泛的使用。下面介绍几种非常著名的，应用于特征提取网络的注意力机制。 SEne...
CBAM: Convolutional Block Attent
1. 摘要我们提出了卷积块注意模块 (CBAM), 一个简单而有效的注意模块的前馈卷积神经网络。给出了一个中间特...

网友评论

本文标题：论文阅读_CBAM卷积网络中使用注意力模型

本文链接：https://www.haomeiwen.com/subject/chbightx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|论文阅读_CBAM卷积网络中使用注意力模型|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！