注意力机制学习

注意力机制学习

作者: 叶天羽 | 来源:发表于2018-11-07 18:58 被阅读0次

Attention机制概念整理
注意力机制学习
pytorch中加入注意力机制（CBAM）
注意力模型的一个实例代码的实现与分析
四万字全面详解 | 深度学习中的注意力机制（完结篇）
(转)注意力机制（Attention Mechanism）在自然
深度学习中的注意力机制
2020 机器翻译 (1)
转《深度学习中的注意力机制》
NLP系列七：理解 Attention【转载】

简要介绍：

所谓的注意力机制，其实就是让系统学会注意力-即关注重点信息忽略无关信息。带有注意力机制的系统，不仅可以自主学习注意力，还可以帮助我们更好的理解神经网络。现在，在计算机视觉当中大多数都是通过掩码来生成注意力，掩码本质上是一组新的权重，可以帮助我们找到需要关注的信息。

目前主要演化出了两种注意力，一种是软注意力，其重点关注的是区域或通道，这种注意力是固定的，可微的；另一种是强注意力，其重点关注的是点，不可微，一般通过强化学习获得。

一、Show , Attend and Tell : Neural Image Caption Generation with Visual Attention

提出了两种注意力方法：使用基本反向传播训练的Soft Attetnion方法和使用强化学习训练的Hard Attention方法。论文关于注意力机制的表述主要在以下几个方面：

1）强注意力机制

$\hat{z_{t} } =\phi ({a_{i} }, {\alpha _{i} })$

$\hat{z_{t} }=\sum_{i}s_{t,i} a_{i}$

其中， $a_{i}$ 代表不同的区域， $s_{t,i}$ 只有0跟1两个值，代表是否被选中，文中将其视为一个隐变量，是位置信息的伯努利分布，此处只是简单介绍，具体推导请看原文。

2）软注意力机制

与强注意力机制不同，软注意力机制对所有的区域都关注，但关注的重要程度不一样。

二、Effective Approaches to Attention-based Neural Machine Translation

提出两种注意力结构，一种global attention，一种local attention。

1、global attention是一种soft attention模型

这种结构将每个时间步都考虑了进去，每个时间步的attention值为：

2、location attention是一种soft attention与hard attention相结合的注意力机制，其只关注一部分source的状态，网络结构如下：

三、Attention Is All You Need

目前有两种常用的注意力函数，一种是加法注意力，一种是点乘注意力，论文用的是点乘注意力，这种注意力更快，更节省空间。事实上，注意力机制就是由query与key-value对组成的映射函数，如下：

通过编码生成key-value，之后解码生成query，利用key与query生成注意力的权重。

论文的一个创新，就是提出了自注意力机制，即用多头注意力实现，实际是对query与key作多次的线性映射。

四、Non-local Neural Networks

有些时候，我们有非局部的需求，所以文章提出了non-local block，用来解决这个问题。

1、主要思想：是一种类似注意力掩膜的东西，可以考虑全部的像素点，且不改变尺寸。

${y_i} = \frac{1}{{c(x)}}\sum\limits_{\forall j} {f({x_i},{x_j})g({x_j})}$

$x$ 是输入信号， $y$ 是输出信号， $f$ 是一种度量函数，用来度量不同位置像素的相关性， $g$ 是一个映射函数，来计算某个点的特征，加权求和之后再进行一个归一化的处理。

一般来说，度量函数有以下四种形式：

为了简单，将 $g$ 设为1*1的卷积。这种模块，与全连接结构有一定的类似，可以这样说，全连接其实是一种特殊的non-local，但是，全连接结构损失了位置的相关性。

2、为什么说这种结构类似于注意力机制呢？是因为这种思想的本质其实就是对不同位置的像素点进行加权，由以下的公式也可以看出：

$y = soft\max ({x^T} \cdot W_\theta ^T \cdot {W_\phi } \cdot x) \cdot g(x)$

就是自注意力机制的那种形式。

3、为了将non-local block加入到cnn结构中，论文将这个模块设计成了残差结构：

${z_i} = {W_z}{y_i} + {x_i}$

PS:这里只是对注意力机制的简单介绍，具体的细节还是要通过论文学习

相关文章

Attention机制概念整理
深度学习中的注意力机制（Attention Macheanism）： Attention机制较为广泛的应用是为了解...
注意力机制学习
简要介绍：所谓的注意力机制，其实就是让系统学会注意力-即关注重点信息忽略无关信息。带有注意力机制的系统，不仅可以...
pytorch中加入注意力机制（CBAM）
第一步：找到ResNet源代码在里面添加通道注意力机制和空间注意力机制所需库通道注意力机制空间注意力机制在R...
注意力模型的一个实例代码的实现与分析
上一篇文章：关于《注意力模型--Attention注意力机制》的学习是对注意力模型的理论知识进行学习，这一篇文章将...
四万字全面详解 | 深度学习中的注意力机制（完结篇）
本部分介绍Attention机制的各种变体。包括但不限于：「基于强化学习的注意力机制」：选择性的Attend输入...
(转)注意力机制（Attention Mechanism）在自然
关键词：注意力机制；Attention机制；自然语言处理；NLP;原文链接地址近年来，深度学习的研究越来越深入，在...
深度学习中的注意力机制
深度学习中的注意力机制分为两种类型： Additive attention 加法注意 Bahdanau：双向rn...
2020 机器翻译 (1)
注意力机制参考《动手学深度学习》参考《李宏毅老师机器学习》相关参考资料 2020机器学习循环神经网(1) 20...
转《深度学习中的注意力机制》
转自张俊林：深度学习中的注意力机制。最近两年，注意力模型（Attention Model）被广泛使用在自然语言处...
NLP系列七：理解 Attention【转载】
转载#干货 | 关于深度学习中的注意力机制，这篇文章从实例到原理都帮你参透了

网友评论

本文标题：注意力机制学习

本文链接：https://www.haomeiwen.com/subject/phbwtqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|注意力机制学习|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！