Transformal的value,key,query理解

Transformal的value,key,query理解

作者: 千千雪人 | 来源:发表于2024-04-25 13:22 被阅读0次

delegate和notification区别，分别在什么情况下
Attention Is All You Need简记(多头注意
getInfoById
iOS学习心得之:KVO
Python学习笔记--dict与set
数据结构-字典
2020-08-12练习
set 与 mset的区别
Python学习笔记5(操作字典)
Redis 入门

在Transformer的自注意力机制中,每个词token都会被映射成一个查询向量(query vector)、一个键向量(key vector)和一个值向量(value vector)。

这三个向量分别来自同一组参数的不同线性投影。

具体来说,对于你给出的句子"我今天吃了一个榴莲,它很好吃。",每个词都会有对应的查询向量、键向量和值向量:

"我"对应的是query_1, key_1, value_1
"今天"对应的是query_2, key_2, value_2
"吃了"对应的是query_3, key_3, value_3
"一个"对应的是query_4, key_4, value_4
"榴莲"对应的是query_5, key_5, value_5
","对应的是query_6, key_6, value_6
"它"对应的是query_7, key_7, value_7
"很"对应的是query_8, key_8, value_8
"好吃"对应的是query_9, key_9, value_9
"。"对应的是query_10, key_10, value_10

这些向量会经过注意力计算,产生每个位置的注意力权重分布,进而得到该位置的注意力表示。自注意力的核心思想是让每个位置的向量和其他所有位置的向量做注意力加权,获取全局信息。

q,v,k是怎么算出来的

在Transformer中,查询向量(Query)、键向量(Key)和值向量(Value)是通过不同的线性变换从输入的词嵌入向量计算得到的,使用的是不同的权重矩阵。

具体来说,假设输入序列为 x=(x1, x2, ..., xn),每个 xi 都是一个词嵌入向量,它们的维度是 d_model。那么对应的 Query、Key、Value 向量是这样计算的:

Query向量:
Q = XWQ
其中 WQ 是可训练的权重矩阵,维度是 (d_model, d_k)
Key向量:
K = XWK
其中 WK 是可训练的权重矩阵,维度是 (d_model, d_k)
Value向量:
V = XWV
其中 WV 是可训练的权重矩阵,维度是 (d_model, d_v)

所以 Q、K、V 都是通过不同的线性变换从输入序列 X 映射得到的,使用了三个不同的可训练权重矩阵 WQ、WK、WV。这些权重矩阵在训练过程中会不断地被优化和更新。

需要注意的是,通常 d_k 和 d_v 的值是人为设置的,一般设置为 d_model 的较小值,目的是为了降低计算复杂度。

上面的x1,x2,x3...解释

x1, x2, x3,...xn 就是指输入序列中的每个单词或者token对应的词嵌入向量。

具体来说,对于输入序列 "我今天吃了一个榴莲,它很好吃。":

x1 是 "我" 这个单词的词嵌入向量
x2 是 "今天" 的词嵌入向量
x3 是 "吃了" 的词嵌入向量
x4 是 "一个" 的词嵌入向量
x5 是 "榴莲" 的词嵌入向量
x6 是 "," 的词嵌入向量
x7 是 "它" 的词嵌入向量
x8 是 "很" 的词嵌入向量
x9 是 "好吃" 的词嵌入向量
x10 是 "。" 的词嵌入向量

所以这些 x1, x2, ..., x10 就是输入到 Transformer 的初始表示,通过线性变换得到对应的 Query、Key、Value 向量,进而计算自注意力。

相关文章

delegate和notification区别，分别在什么情况下
KVC(Key-Value-Coding)KVO（Key-Value-Observing）理解KVC与KVO（键-...
Attention Is All You Need简记(多头注意
首先注意力模型可以宏观上理解为一个查询（query）到一系列（键key-值value）对的映射。将Source（源...
getInfoById
2.第二种第一种 {personId: this.$route.query.personId} key:value
iOS学习心得之:KVO
KVO 是 key/value/observing 的缩写个人理解的意思是:当对应的key的值value发生改变时...
Python学习笔记--dict与set
一. dict的形式 dict={ key:value, key:value, key:value, .....
数据结构-字典
字典字典可以理解为键值对，类似于 d = {key1 : value1, key2 : value2 }。字典...
2020-08-12练习
遍历key,value,key-value
set 与 mset的区别
SET key valueMSET key value [key value ...] 欢迎加入QQ群: CTP/...
Python学习笔记5(操作字典)
aDict = {'key1':'value1', 'key2':'value2', 'key3':'value3...
Redis 入门
Redis是一个key-value存储系统。(Key-Value Store) Key-Value Store的可...

网友评论

本文标题：Transformal的value,key,query理解

本文链接：https://www.haomeiwen.com/subject/rsdnxjtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Transformal的value,key,query理解|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！