Day 2574：学习

作者: kafkaliu | 来源:发表于2024-02-12 21:33 被阅读0次

智谱清言，阅读 Attention Is All You Need 这篇论文

提示语：

（详细的不贴了）这篇论文提出了一种新的深度学习模型——Transformer, 完全基于自注意力机制，在序列转序列任务上取得了新的最优结果，同时计算速度更快，训练时间更短

更高的并行计算能力、更长的最大路径长度、更低的计算复杂度、更快的训练速度等

Transformer 采用自注意力机制，每个位置只需要访问一次上下文信息，每个位置可以并行计算，RNN 是顺序计算。Transformer 中的所有操作都基于矩阵运算，可以更高效地利用 GPU。CNN 卷积操作涉及窗口元素的顺序计算

网友评论

本文标题：Day 2574：学习

本文链接：https://www.haomeiwen.com/subject/iorjadtx.html

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！