美文网首页
正则化的一些理解

正则化的一些理解

作者: miahuang | 来源:发表于2019-08-28 10:16 被阅读0次

今天看百面机器学习的书.书上提到改善模型过拟合的一个方法是加正则化项.这句话其实已经不止第一次见了,但是每次都没有想想为什么.现在记录一下自己的理解.

为什么会过拟合

机器学习的前提条件是训练集和测试集都是独立同分布,机器学习目的就是利用数据学习某种pattern的表达 .我们常常可以使用一个多项式函数f(x)=w_0x_0+w_1x_1+...w_nx_n表达某个pattern.这个多项式就越如果我们的数据集包括这个pattern所有情况,那么学习的结果就会非常好.但是,往往我们的输入数据都是不完备的,那么学习到的pattern就不完备,不够准确,这种不准确表达出来两种结果,一种是underfitting(欠拟合),另一种是过拟合(overfitting)。最左边是欠拟合,最右边是过拟合.过拟合原因就是f(x)多项式的N特别的大,越复杂模型需要提供的特征越多,或者说提供的测试用例中我们使用到的特征非常多.

fitting_result.png

过拟合的解决方法

已经知道过拟合的原因是f(x)多项式的N特别大,那么解决方法就是减少N.更具体的说,减少N的数量,也就是而让N最小化,也就是让向量W中项的个数最小化,这个过程用一个学术语言描述就叫正则化.0范数,L1范数,L2范数都是实现W向量中的个数最小化,只是细节上有所不同.将范数套在过拟合的解释分别是:0范数,表示向量W中非零元素的个数.1范数,表示向量W绝对值之和.2范数,就是向量W的模。1范数计算向量W的元素变成0, 2范数使得向量W的元素趋近于0,都在做减少W的元素数量.

总结

f(x)多项式加入范数项,使得W向量的元素个数最小化,进而减少N,导致的结果就是改善过拟合的现象.另外,解决过拟合是不是只有上面提到的方法,答案是否定的.增加训练数据量也是可以的.

相关文章

  • 正则化的一些理解

    今天看百面机器学习的书.书上提到改善模型过拟合的一个方法是加正则化项.这句话其实已经不止第一次见了,但是每次都没有...

  • 关于正则化的理解

    什么是正则化?为什么要正则化?怎样正则化? 对正则化化一直不是十分理解,只知道正则化可以防止过拟合。为什么给los...

  • 5- 深度学习之神经网络核心原理与算法-正则化

    正则化 正则化是机器学习中一种常见的概念。正则化不仅在深度学习中有,在传统的机器学习中也有。 单纯从名字上不好理解...

  • 机器学习基础(6)- L1和L2正则区别

    本文主要用于理解正则化的原理,并且重点比较了L1与L2这两种正则化方法的区别。 基本目录如下: 正则化的原理1.1...

  • 正则化总结

    什么是正则,为什么要正则 机器学习深度学习中的正则化(regularization)可以理解为模型的复杂度。我们希...

  • 关于正则化的理解

    正则化是通过改变模型参数来防止过拟合的一个方法。 前面使用多项式回归,如果多项式最高次项比较大,模型就容易出现过拟...

  • 在线正则表达式测试工具

    分享正则表达式可视化器和测试工具。 正则表达式可视化器 图形化显示正则表达式这样容易理解点。main_page1 ...

  • 机器学习 - 线性回归中的正则化

    为什么要正则化? 正则化的本质是什么? 正则化有哪些方法? 1.为什么要正则化? 正则化可以解决模型过拟合的问题,...

  • Python数据科学:正则化方法!

    本文主要介绍,Python数据科学:正则化方法。正则化方法的出现,通过收缩方法(正则化方法)进行回归。 正则化方法...

  • 通俗易懂--岭回归(L2)、lasso回归(L1)、Elasti

    1.L2正则化(岭回归) 1.1问题 想要理解什么是正则化,首先我们先来了解上图的方程式。当训练的特征和数据很少时...

网友评论

      本文标题:正则化的一些理解

      本文链接:https://www.haomeiwen.com/subject/zbirectx.html