batch norm和layer norm

batch norm和layer norm

作者: 来到了没有知识的荒原 | 来源:发表于2022-03-12 15:34 被阅读0次

Batch Norm和Layer Norm
batch norm和layer norm
哪里使用BN
batch norm, layer norm and insta
吴恩达深度学习笔记(52)-将 Batch Norm 拟合进神经
吴恩达深度学习笔记(53)-Batch Norm 为什么奏效
吴恩达深度学习笔记(54)-测试时的 Batch Norm
Batch Norm
Batch_ normalization、Layer_ norm
batch norm笔记

https://zhuanlan.zhihu.com/p/86765356

batch norm

计算batch个μ和batch个σ

layer norm

我以前一直以为是对seq轴上做类似于batch norm的操作，结果是hidden轴上。

例如，input是[ batch × seq_len × hidden ]，则layer norm首先在hidden维度求出batch × seq_len个标准差和均值，再使用它们进行归一化，但γ和β只有hidden个，因此LayerNorm归一化之后的缩放是再特征维度上进行。

class LayerNorm(nn.Module):
    "Construct a layernorm module (See citation for details)."
    def __init__(self, features, eps=1e-6):
        super(LayerNorm, self).__init__()
        self.a_2 = nn.Parameter(torch.ones(features))
        self.b_2 = nn.Parameter(torch.zeros(features))
        self.eps = eps

    def forward(self, x):
        # mean(-1) 表示 mean(len(x)), 这里的-1就是最后一个维度，也就是hidden_size维
        mean = x.mean(-1, keepdim=True)
        std = x.std(-1, keepdim=True)
        return self.a_2 * (x - mean) / (std + self.eps) + self.b_2

区别：

Batch Normalization，它去除了不同特征之间的大小关系，但是保留了不同样本间的大小关系，所以在CV领域用的多。
Layer Normalization，它去除了不同样本间的大小关系，但是保留了一个样本内不同特征之间的大小关系，所以在NLP领域用的多。

1）layer normalization 有助于得到一个球体空间中符合0均值1方差高斯分布的 embedding， batch normalization不具备这个功能。

layer normalization可以对transformer学习过程中由于多词条embedding累加可能带来的“尺度”问题施加约束，相当于对表达每个词一词多义的空间施加了约束，有效降低模型方差。batch normalization也不具备这个功能。

相关文章

Batch Norm和Layer Norm
深度学习中的ICS问题？ covariate shift 是分布不一致假设之下的一个分支问题，它是指源空间和目标空...
batch norm和layer norm
https://zhuanlan.zhihu.com/p/86765356[https://zhuanlan.zh...
哪里使用BN
The batch norm layer is used after linear layers (ie: FC,...
batch norm, layer norm and insta
http://mlexplained.com/2018/11/30/an-overview-of-normaliz...
吴恩达深度学习笔记(52)-将 Batch Norm 拟合进神经
Batch Norm 拟合进神经网络（Fitting Batch Norm into a neural netwo...
吴恩达深度学习笔记(53)-Batch Norm 为什么奏效
Batch Norm 为什么奏效？（Why does Batch Norm work?）为什么Batch归一化会...
吴恩达深度学习笔记(54)-测试时的 Batch Norm
测试时的 Batch Norm（Batch Norm at test time） Batch归一化将你的数据以mi...
Batch Norm
Normalizing activations in a network 在机器学习中很多算法都是通过添加变量来获...
Batch_ normalization、Layer_ norm
1、先说为什么会有BN：我们在训练一个深度网络的时候，每一层的结果对整体结果都有很大影响的。而我们每次网络的输入...
batch norm笔记
姓名：毕晓鹏学号：19021210824 【嵌牛导读】批归一化在深度学习网络训练中是很重要的一部分，可以加快网络...

网友评论

本文标题：batch norm和layer norm

本文链接：https://www.haomeiwen.com/subject/knukdrtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|batch norm和layer norm|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！