2021-02-05

2021-02-05

作者: 静一下1 | 来源:发表于2021-02-04 23:51 被阅读0次

人们做饭比以前少了
我国网民规模达到十亿
周五 2021-02-05 23:30 - 07:00 阴 02
2021-02-05
2021-02-05打破边界，建立边界
小年
2021-02-05
周龑说书:我和三个宝贝的故事（四十一）
致人类书：（94）宇宙意识是一个全息图，我们都位于其中
每日论语

1.整体结构

2.特征提取：

Fbank：

特征处理：标准化

3.位置编码

初始的inputs：

4.Attention

缩放因子的作用在论文中提到是为了缓解当 $\sqrt{d_k}$ 过大时带来的softmax梯度过小问题：

举个例子假定输入为 x=【a,a,2a】

然后我们来看softmax的梯度。不妨简记softmax函数为 $g(.)$ ，softmax得到的分布向量 $\hat{y} = g(x)$ 对输入 $x$ 的梯度为：

记 $X=q_i,Y=k_i$ , 有 $D(X)=D(Y)=1,E(X)=E(Y)=0$

则：

$E(XY)=E(X)E(Y)=0 \times 0=0$

$D(XY)=E(X^2 \cdot Y^2)-[E(XY)]^2 \\ =E(X^2)E(Y^2)-[E(X)E(Y)]^2\\=E(X^2 - [E(X)]^2)E(Y^2-[E(Y)]^2)-[E(X)E(Y)]^2\\=D(X)D(Y)-[E(X)E(Y)]^2 \\=1\times 1 -(0\times0)^2\\=1$

对相互独立的分量 $Z_i$ ,有

$E(\sum_i Z_i)=\sum_i E(Z_i)$

$D(\sum_i Z_i)=\sum_i D(Z_i)$

所以： $E(q\cdot k)=0,D(q\cdot k)=d_k$ （下面做了一个验证）,方差越大也就说明，点积的数量级越大。

除以 $\sqrt{d_k}$ 可以让方差稳定在1，因为 $D(q\cdot k/\sqrt{d_k})=d_k/(\sqrt{d_k})^2=1$ ,将方差控制为1，也就有效地控制了前面提到的梯度消失的问题。

相关文章

人们做饭比以前少了
People Are Cooking Less Than Ever Before 2021-02-05 337词 ...
我国网民规模达到十亿
China Has Nearly 1b Internet Users 2021-02-05 126词高考热点 T...
周五 2021-02-05 23:30 - 07:00 阴 02
周五 2021-02-05 23:30 - 07:00 阴 02h51m 记录闪现的灵感(inspirations...
2021-02-05
2021-02-05 亲子共读，快乐生活 180-181/1000 英语学习这个相对简单一点，挑战也不错 -_-...
2021-02-05打破边界，建立边界
【2021-02-05日精进第262天/1825】表现：9分孩子交流占用晨间阅读时间。孩子的交流内容恰好是正...
小年
2021-02-05（农历腊月廿四）日精进第18天 | 没有记录就没有发生 2021年的事业梦想个人目标描述：达成...
2021-02-05
直面金钱，接纳欲望 2021-02-05 财商课复盘听了几天的课，还是很有收获的，起码这是除了在洛阳被保险公司的...
周龑说书:我和三个宝贝的故事（四十一）
木兰丹青我和三个宝贝的故事 2021-02-05 05:40:16 0 第41回爱看电视的猫说起我的外甥咪咔...
致人类书：（94）宇宙意识是一个全息图，我们都位于其中
鸢尾天空2021-02-05 16:31:04 日安，我们是阿柯图-瑞恩！我们是你们意识的一部分，如同你们是我们...
每日论语
一个人要修炼好的三招 2021-02-05 来源：孔子曰：“不知命，无以为君子也；不知礼，无以立也；不知言，无以...

网友评论

本文标题：2021-02-05

本文链接：https://www.haomeiwen.com/subject/poxitltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|2021-02-05|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！