美文网首页
L1与L2正则

L1与L2正则

作者: 惊不意外 | 来源:发表于2019-04-21 20:34 被阅读0次

    L1正则假设参数的先验分布是Laplace分布,可以保证模型的稀疏性,也就是某些参数等于0;
    L2正则假设参数的先验分布是Gaussian分布,可以保证模型的稳定性,也就是参数的值不会太大或太小

    在实际使用中,如果特征是高维稀疏的,则使用L1正则;如果特征是低维稠密的,则使用L2正则。

    L2 regularizer :使得模型的解偏向于范数较小的 W,通过限制 W 范数的大小实现了对模型空间的限制,从而在一定程度上避免了 overfitting 。不过 ridge regression 并不具有产生稀疏解的能力,得到的系数仍然需要数据中的所有特征才能计算预测结果,从计算量上来说并没有得到改观。
    L1 regularizer :它的优良性质是能产生稀疏性,导致 W 中许多项变成零。 稀疏的解除了计算量上的好处之外,更重要的是更具有“可解释性”。

    右侧是L1正则,最优解位于坐标轴上,意味着某些参数是0

    相关文章

      网友评论

          本文标题:L1与L2正则

          本文链接:https://www.haomeiwen.com/subject/dnyjgqtx.html