美文网首页
L1和L2损失函数与正则的区别

L1和L2损失函数与正则的区别

作者: Stefan0 | 来源:发表于2018-11-21 09:43 被阅读0次

作为损失函数:
L1 也被称为最小绝对值偏差(LAD),最小绝对值误差(LAE)。它是使目标值与预测值的绝对值总和最小化


图片.png

L2范数损失函数,也被称为最小平方误差(LSE)。它是目标值和预测值平方差的最小化。


图片.png

作为损失函数 L1和L2的区别如下:

图片.png
转自https://www.jianshu.com/p/d4c6f7b48928 图片.png

作为正则化:
在机器学习中,正规化是防止过拟合的一种重要技巧。从数学上讲,它会增加一个正则项,防止系数拟合得过好以至于过拟合。L1与L2的区别只在于,L2是权重的平方和,而L1就是权重的和。如下:

图片.png

他们的性质和区别:


图片.png

内置特征选择是L1范数被经常提及的有用的性质,而L2范数并不具备。这是L1范数的自然结果,它趋向于产生稀疏的系数(在后面会解释)。假设模型有100个系数,但是仅仅只有其中的10个是非零的,这实际上是说“其余的90个系数在预测目标值时都是无用的”。L2范数产生非稀疏的系数,因此它不具备这个性质。
  稀疏性指的是一个矩阵(或向量)中只有少数的项是非零的。L1范数具备性质:产生许多0或非常小的系数和少量大的系数。
  计算效率。L1范数没有一个解析解,但是L2范数有。这就允许L2范数在计算上能高效地计算。然而,L1范数的解具备稀疏性,这就允许它可以使用稀疏算法,以使得计算更加高效。

作者:但盼风雨来_jc
链接:https://www.jianshu.com/p/d4c6f7b48928
來源:简书
(说明:仅作为笔记使用 如有侵权 必当删之)

相关文章

  • 深度学习dropout作用与原理

    Dropout 作用: 避免过拟合。 Dropout与L1和L2正则化区别: L1和L2正则化通过在损失函数上增加...

  • L1正则化和L2正则化的联系和区别

    机器学习中,一般损失函数后边会添加一个额外项,一般称作L1正则化L2正则化或者L1范数L2范数。L1、L2正则化可...

  • 算法工程师面试问题汇总 [持续更新]

    机器学习 LR算法基本原理?交叉熵损失函数?L1,L2正则化? HMM, CRF区别?基本原理?优化方法&目标函数...

  • L1和L2正则化

    L1正则化和L2正则化可以看做是损失函数的惩罚项。所谓『惩罚』是指对损失函数中的某些参数做一些限制。对于线性回归模...

  • 深度学习的正则化

    正则化是为了降低模型的复杂度,和损失函数一起作用于模型中来避免模型过拟合。主要有L1正则化和L2正则化。L1正则化...

  • 损失函数概述

    常用的损失函数 1.L1损失(绝对损失函数) 和 L2 损失(平方损失函数) L1范数损失函数,也被称为 最小绝对...

  • 学习笔记-L1与L2正则化

    当模型过拟合时,我们常常使用正则化去减轻模型的复杂度。它主要在损失函数后添加正则项去约束模型。 L1与L2正则化 ...

  • DL4J中文文档/开始/速查表-2

    正则化 L1/L2 正则化 L1和L2正则化可以容易地通过配置:.l1(0.1).l2(0.2)添加到网络中。注意...

  • Logistic模型及其Scikit-learn实现

    penalty:正则化参数,可选l1或l2,分别对应l1正则化和l2正则化,默认为l2正则化。一般来说l2正则化可...

  • L1和L2损失函数与正则的区别

    作为损失函数:L1 也被称为最小绝对值偏差(LAD),最小绝对值误差(LAE)。它是使目标值与预测值的绝对值总和最...

网友评论

      本文标题:L1和L2损失函数与正则的区别

      本文链接:https://www.haomeiwen.com/subject/efdqqqtx.html