过拟合解决方法之L2正则化和Dropout

过拟合解决方法之L2正则化和Dropout

作者: zenRRan | 来源:发表于2018-01-28 20:02 被阅读194次

深度学习dropout作用与原理
正则化方法
吴恩达深度学习笔记(34)-你不知道的其他正则化方法
吴恩达深度学习笔记(32)-Dropout正则化Dropout
task03
过拟合解决方法之L2正则化和Dropout
pytorch之Dropout
吴恩达机器学习- 正则化
tensorflow初学
Pytorch 任务五

什么是过拟合？

一幅图胜千言万语

欠拟合

正确的拟合

过拟合

过拟合(overfitting)：就是对数据的过度严格的拟合。这个经常出现在分类问题上。

怎么解决过拟合呢？

L2正则化

逻辑回归中L2正则化的过程：

L2正则化是最常用的正则化。

我们先求出代价方程J(w,b)为：

代价方程

L2正则化，就是在代价方程后面加个lambda/(2m)参数W范数的平方,下标2表示L2正则化的意思，2是为了接下来的求导好化简而写的，就是个比值而已：

L2正则化

其中||w||^2是：

||w||^2

但是为啥参数W都用上了，为啥不+bias b：

因为，b也是一个参数，而且是一个数，而W是很多个参数，感觉少了b也没啥所以一般不写上b。

这里的lambda是超级参数，跟学习率一样，需要我们自己调。

神经网络 L2回归的过程：

神经网络其实就是有大于等于1个隐藏层，也就是比逻辑回归多了参数而已：

代价函数

其中||W||为：

注：L-1=上一层的大小，L是当前层的大小

该||W||矩阵范式被称为Frobenius norm 即弗罗贝尼乌斯范数，表示为(||W||_F)^2:

2->F

这个矩阵L2范式，也叫弗罗贝尼乌斯范数。

求导：

没有L2正则化以后，导数是这样的，[from backprop: 从反馈传播求得的]:

而现在有了L2正则以后，就变成了：

其中可以看出和上面的原本的W^[L]比，缩小成了下面的倍数（其中alpha>1）：

这个W的缩小变化使得L2正则化被称为“权重衰退”。

有L2正则化就有L1正则化，但是为啥不用呢？

L1正则化的||W||为:

L1正则化||W||

L1的正则化的||W||会使得W最终变得稀疏，也就是有很多0出现，有助于压缩参数和减小内存，但这也不是我们用L1正则化的目的，不是为了压缩模型。(这个斜体加粗的话我还没弄懂为啥会出现很多0，知道的小伙伴分享下)

Dropout

Dropout有很多，其中Inverted Dropout 反向随机失活最常用。根据这个翻译的意思，也能大概猜出来Inverted Dropout的意思，也就是从后面随机使一些当前层的神经单元失效。

上图说话：

没Dropout前的网络为：

开始Dropout操作：

注释：红叉的单元是被去除的，也就是该单元权重置为0。

这个dropout操作是从每一层开始的，首先需要设置一个值，keep_prob，就是保留多少，范围0-1。这个例子很明显是0.5。然后在从后往前经过每一层，都把当前层随机流线keep_prob的比例，其他的单元的权重置为零。

代码模拟实现为：

感谢Andrew Ng的视频！

欢迎关注深度学习自然语言处理公众号

相关文章

深度学习dropout作用与原理
Dropout 作用：避免过拟合。 Dropout与L1和L2正则化区别： L1和L2正则化通过在损失函数上增加...
正则化方法
正则化的作用正则化是为了防止过拟合采取的策略，主要的正则化方法有L1、L2、dropout、dropconnec...
吴恩达深度学习笔记(34)-你不知道的其他正则化方法
除了L2正则化和随机失活（dropout）正则化，还有几种方法可以减少神经网络中的过拟合: 一.数据扩增假设你正...
吴恩达深度学习笔记(32)-Dropout正则化Dropout
dropout 正则化（Dropout Regularization）除了L2正则化，还有一个非常实用的正则化方...
task03
过拟合、欠拟合及其解决方案过拟合与欠拟合欠拟合过拟合解决方案权重衰减 L2 范数正则化范数正则化在模型...
过拟合解决方法之L2正则化和Dropout
什么是过拟合？一幅图胜千言万语过拟合(overfitting)：就是对数据的过度严格的拟合。这个经常出现在分类...
pytorch之Dropout
解决loss过拟合问题：在loss函数中加入正则化项，Dropout等途径 Dropout 带Dropout的网...
吴恩达机器学习- 正则化
过拟合和欠拟合定义和形态解决方法减少特征值数量正则化正则化惩罚θ系数线性回归正则化逻辑回归正则化
tensorflow初学
tensorflow 优化：如何减少过拟合： dropout 正则化减少隐含层的层级数目
Pytorch 任务五
PyTorch实现L1，L2正则化以及Dropout

网友评论

本文标题：过拟合解决方法之L2正则化和Dropout

本文链接：https://www.haomeiwen.com/subject/pxdzaxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

大数据，机器学习，人工智能

深度学习·神经网络·计算机视觉

Python语言与信息数据获取和机器学习

热点阅读

深度学习

大数据，机器学习，人工智能

深度学习·神经网络·计算机视觉

Python语言与信息数据获取和机器学习

关于我们|服务条款|联系我们|过拟合解决方法之L2正则化和Dropout|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！