美文网首页
【论文阅读】GCNet: Non-local Networks

【论文阅读】GCNet: Non-local Networks

作者: 昭君姐 | 来源:发表于2019-07-16 20:34 被阅读0次

URL:
论文pdf
github

TL;DR

融合Non-Local Network和SENet两个方法。
精简了Non-Local的计算复杂度。


方法

Non-Local不同位置上的显著图
Simplified NL Block

首先是对Non Local的改进,non local中包含一个self-attention操作,计算复杂。但实际上,如上图,其中每个图代表红点位置对应的热度图,不同位置之间其实没有明显差别,故此本文对此做了精简。直接将HW*HW大小的不同位置的关系图f(x_i,x_j)降为了HW*1*1,但相应的feature最终的大小也变为了C*1*1。此外,由于前人的工作,有没有W_z不太重要,故此将W_z省去。Simplified NL Block的公式如下。
\mathbf{z}_{i}=\mathbf{x}_{i}+\sum_{j=1}^{N_{p}} \frac{\exp \left(W_{k} \mathbf{x}_{j}\right)}{\sum_{m=1}^{N_{p}} \exp \left(W_{k} \mathbf{x}_{m}\right)}\left(W_{v} \cdot \mathbf{x}_{j}\right)
可以看出W_v是可以移到attention外的,故此进一步精简计算量变为下图中的(b)。

GC Block

对比SE Net发现,Non-Local和SE都可以抽象为context modeling + transform两个阶段,因此可以用se block的transform阶段优化下non local,在有non-local的spatial attention的情况下引入se的channel spatial,最终形成图d的GC block。同时也可以说SE的GAP是non-local的一种特殊形式。

实验

实验结果

表4可以看出相对于原始模型,GC Block明显增加了参数量,但计算量没有明显增加。相对于No-Local而言,计算量明显下降。符合预期。
此外,在实际任务上也能取得明显的涨点。

相关文章

网友评论

      本文标题:【论文阅读】GCNet: Non-local Networks

      本文链接:https://www.haomeiwen.com/subject/aekxlctx.html