Transformer Network

Transformer Network

作者: oword | 来源:发表于2021-05-02 19:21 被阅读0次

Transformer Network
Pytorch中的仿射变换(affine_grid)
8.NN特殊结构(1)——Spatial Transformer
9.NN特殊结构(2)——Highway Network &am
10.NN特殊结构(3)——Recursive Network
Bottleneck Transformers for Visu
手撸一个Transformer
Transformer学习资料
Transformer 模型总结
2021-02-23

coursera deeplearning
一、组成

image.png

二、self-attention
self-attention 是 Transformer Network 中比较核心的部分，目的是使文本中某个单词与其他单词产生联系，产生联系后的单词为 z

1、在 self-attention 当中输入单词数和输出单词数一致

v2-ace271b3d7094074aabfc743afd2e841_r.jpg

2、计算过程

a single attention function:

image.png

image.png

Q : 向量
K : 向量
V : 向量
dk : 向量维度
认为两个向量越相近，相乘值越高

三、Multi-head attention
多头注意力机制就是将多个 single attention function 的结果进行 concat 拼接，拼接后再与一个矩阵相乘，认为不同的输入 z 关注不同距离的注意力 attention

对第 i one head:

image.png

Mutil-Head :

image.png

image.png

四、Position Encoding
为了体现单词之间的相对关系，使用 Position Encoding ，在 Input Embedding 之后与 Position Encoding 相加

五、encoder & decoder
encoder : 生成 K V 矩阵
decoder : 生成 Q 矩阵
交互如下：

image.png

image.png

image.png

六、其他
Norm : 使用了归一化但和 BN 不同
Feed Forward : 全连接
N× : 有 N 个 encoder 和 N 个 decoder

参考
https://zhuanlan.zhihu.com/p/46990010
https://www.bilibili.com/video/BV1Di4y1c7Zm?p=7
https://www.bilibili.com/video/BV1L54y1a7Y3

相关文章

Transformer Network
coursera deeplearning一、组成二、self-attentionself-attention ...
Pytorch中的仿射变换(affine_grid)
在看 pytorch 的 Spatial Transformer Network 教程时，在 stn 层中的 a...
8.NN特殊结构(1)——Spatial Transformer
这里介绍三种特殊的结构：spatial transformer layer，highway network & g...
9.NN特殊结构(2)——Highway Network &am
这里介绍三种特殊的结构：spatial transformer layer，highway network & g...
10.NN特殊结构(3)——Recursive Network
这里介绍三种特殊的结构：spatial transformer layer，highway network & g...
Bottleneck Transformers for Visu
谷歌和伯克利一起提出的Bottleneck Transformer（BoT）属于一种hybrid network，...
手撸一个Transformer
Transformer 关于Transformer的理论学习：Transformer详解[https://blog...
Transformer学习资料
The Illustrated Transformer The Illustrated Transformer【译...
Transformer 模型总结
1、Transformer 模型的结构图 2、Transformer 模型简述 Transformer 是由多个 ...
2021-02-23
open transformer 参数： speech transformer参数： th30：这里可以看出测试...

网友评论

本文标题：Transformer Network

本文链接：https://www.haomeiwen.com/subject/waotdltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Transformer Network|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！