R-Drop：神经网络的正则化Dropout

R-Drop：神经网络的正则化Dropout

作者: Valar_Morghulis | 来源:发表于2023-01-12 07:40 被阅读0次

吴恩达深度学习笔记(32)-Dropout正则化Dropout
【Keras】减少过拟合的秘诀——Dropout正则化
吴恩达深度学习笔记(34)-你不知道的其他正则化方法
pytorch之Dropout
正则化、dropout深层神经网络
深度学习dropout作用与原理
最好的的Dropout讲解【转载】
正则化方法
Dropout正则化
正则化dropout

R-Drop: Regularized Dropout for Neural Networks

Jun 2021

https://arxiv.org/abs/2106.14448

NeurIPS 2021

https://github.com/dropreg/R-Drop

Dropout是一种强大且广泛使用的技术，用于正则深度神经网络的训练。在本文中，我们在模型训练中引入了一种简单的基于Dropout的正则化策略，即R-Drop，它迫使由Dropout生成的不同子模型的输出分布彼此一致。具体地说，对于每个训练样本，R-Drop最小化了由Dropout采样的两个子模型的输出分布之间的双向KL偏差。理论分析表明，R-Drop减少了模型参数的自由度，补充了丢失。在5个广泛使用的深度学习任务（共18个数据集）上的实验表明，R-Drop普遍有效，这些任务包括神经机器翻译、抽象摘要、语言理解、语言建模和图像分类。特别是，当应用于微调大型预训练模型（如ViT、RoBERTa大型和BART）时，它会产生显著的改进，并通过WMT14英语上的vanilla Transformer模型实现最先进的（SOTA）性能→德语翻译（30.91 BLEU）和WMT14英语→法语翻译（43.95 BLEU），甚至超过了用超大规模数据训练的模型和专家设计的Transformer模型的高级变体。

相关文章

吴恩达深度学习笔记(32)-Dropout正则化Dropout
dropout 正则化（Dropout Regularization）除了L2正则化，还有一个非常实用的正则化方...
【Keras】减少过拟合的秘诀——Dropout正则化
摘要： Dropout正则化是最简单的神经网络正则化方法。阅读完本文，你就学会了在Keras框架中，如何将深度学习...
吴恩达深度学习笔记(34)-你不知道的其他正则化方法
除了L2正则化和随机失活（dropout）正则化，还有几种方法可以减少神经网络中的过拟合: 一.数据扩增假设你正...
pytorch之Dropout
解决loss过拟合问题：在loss函数中加入正则化项，Dropout等途径 Dropout 带Dropout的网...
正则化、dropout深层神经网络
-- coding: utf-8 -- """Created on Sun Sep 30 22:57:44 201...
深度学习dropout作用与原理
Dropout 作用：避免过拟合。 Dropout与L1和L2正则化区别： L1和L2正则化通过在损失函数上增加...
最好的的Dropout讲解【转载】
原文链接Dropout (Dropout)(Srivastava et al., 2014) 提供了正则化一大类模...
正则化方法
正则化的作用正则化是为了防止过拟合采取的策略，主要的正则化方法有L1、L2、dropout、dropconnec...
Dropout正则化
理解dropout 用于解决过拟合问题 Dropout存在两个版本：直接（不常用）和反转。(这里只对Inverte...
正则化dropout
Dropout方法总结：在前向传播算法和反向传播算法训练模型时，每轮梯度下降迭代时，它需要将训练数据分成若干批，然...

网友评论

本文标题：R-Drop：神经网络的正则化Dropout

本文链接：https://www.haomeiwen.com/subject/odipcdtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|R-Drop：神经网络的正则化Dropout|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！