Transformer笔记

Transformer笔记

作者: bobby96 | 来源:发表于2019-03-20 19:11 被阅读0次

transformer笔记
Transformer笔记
突破瓶颈，打造更强大的 Transformer
Transformer-XL: 在自注意力模型中处理长距离依赖
手撸一个Transformer
图解Transformer笔记
Transformer 阅读笔记
Transformer量化笔记
Transformer学习资料
Transformer 模型总结

1. 模型结构示意图：

transformer.gif

这显示transformer有以下特征：

encoder部分有一种堆叠的效果，可以堆叠多个layer，而且每一层layer的模式是一样的。
每一层都有self attention的效果，而所谓的self attention就是让词两两之间产生作用，并进行sum求和。
可以预想到，这样可以进行长距离依赖的捕捉。
在decoder阶段，需要考虑最后一层的encoder的输出，以及之前时刻的decoder在当前layer的输出结果，来得到下一层的输入。

2. 如何进行self attention？

可以看图片的时候思考几个问题：

transformer中是用什么方法进行的attention?dot product，biaffine etc？
进行attention的表示与词的原始的embedding之间有何关系？
计算attention时，一个词作为query或者是作为被attent的词，的表示是否有区别？如何做到这一点。
what is q k v.jpg
首先得到一个词的q,k,v的表示，作为query，key和最后的value都不一样。这样为之后的点积起效果打下了预备。
self attention layer.jpg
注意这里面有根据维度进行归一化的内容。然后要对value做加权。
matrix manipulation.jpg
这个式子代码里面应该能直接看到。很系统完整。描述了整个self attention layer的工作的流程。因为示例中有两个单词，所以Q的第一维是2。
multi-head.jpg
multihead的实质就是多搞几套。如果原来的输出的Z的维度是 $d$ , $head$ 的值为4，那么在multihead下最终的Z的维度就是 $4d$ ,不过是将最终的结果concat一下罢了。将concat的结果与 $W^O$ 乘一下得到本层输出。

相关文章

transformer笔记
transoformer结构是大名鼎鼎的论文《attention is all you need》提出的，基于se...
Transformer笔记
1. 模型结构示意图：这显示transformer有以下特征： encoder部分有一种堆叠的效果，可以堆叠多个...
突破瓶颈，打造更强大的 Transformer
搬运+论文笔记的笔记突破瓶颈，打造更强大的 Transformer[https://wmathor.com/ind...
Transformer-XL: 在自注意力模型中处理长距离依赖
我的博客：菱歌's Blog | 听见美好笔记原文地址：论文阅读笔记（3）：Transformer-XL 论文题...
手撸一个Transformer
Transformer 关于Transformer的理论学习：Transformer详解[https://blog...
图解Transformer笔记
Transformer模型是在Attention Is All You Need中提出的模型。讲解Transfor...
Transformer 阅读笔记
Transformer 模型是谷歌大脑在2017年发表论文《Attention is all you need ...
Transformer量化笔记
前言 AI芯片（这里只谈FPGA芯片用于神经网络加速）的优化主要有三个方面：算法优化，编译器优化以及硬件优化。算法...
Transformer学习资料
The Illustrated Transformer The Illustrated Transformer【译...
Transformer 模型总结
1、Transformer 模型的结构图 2、Transformer 模型简述 Transformer 是由多个 ...

网友评论

本文标题：Transformer笔记

本文链接：https://www.haomeiwen.com/subject/pmgtvqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Transformer笔记|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！