美文网首页
机器学习过拟合的解决方法

机器学习过拟合的解决方法

作者: watersky01 | 来源:发表于2019-01-10 18:31 被阅读0次

过拟合

学习器在训练集上面的误差称为“训练误差”或“经验误差”,新样本上面的误差称为“泛化误差”。当学习器把训练集训练的“太好”,把训练样本自身的一些特点当做所有潜在样本的性质,导致泛化能力下降,称为过拟合,表现为模型在训练集上面效果好,在测试集上效果差,即训练误差减小,而泛化误差增加。与之相对的是“欠拟合”。

防止过拟合的方法:

1、增大数据集

2、Early Stopping

3、正则化,常用L1、L2正则化

4、Dropout

增大数据集

a、从数据源头获取更多数据

b、数据增强:通过一定规则扩充数据。如在物体分类问题里,物体在图像中的位置、姿态、尺度,整体图片明暗度等都不会影响分类结果,通过图像平移、翻转、缩放、裁剪等将数据扩充;

Early Stopping 通过迭代次数截断的方法来防止过拟合的方法,当在训练集上误差较小,在验证集误差开始增大时停止训练。

3、L1正则化 C = C0+\lambda \sum_{i=1}^n|w_{i} |

L2正则化C = C0+\lambda \sum_{i=1}^nw_{i}^2

L1会带来稀疏矩阵,L2会使参数更小

4、Dropout

在训练开始时,随机得删除一些隐藏层神经元(1/2,1/3,1/4),,相当于训练了很多个只有半数隐层单元的神经网络,每一个这样的半数网络,都可以给出一个分类结果,这些结果有的是正确的,有的是错误的。随着训练的进行,大部分半数网络都可以给出正确的分类结果,那么少数的错误分类结果就不会对最终结果造成大的影响。

相关文章

  • 学习笔记

    机器学习理论基础 来自《scikit-learn机器学习》 过拟合和欠拟合 过拟合是指模型能很好的拟合训练样本,但...

  • 机器学习过拟合的解决方法

    过拟合 学习器在训练集上面的误差称为“训练误差”或“经验误差”,新样本上面的误差称为“泛化误差”。当学习器把训练集...

  • 学习笔记:Python深度学习

    机器学习基础 过拟合和欠拟合 机器学习的根本问题是optimization和generalization之间的对立...

  • 学习笔记----机器学习(六)

    机器学习基础理论 模型过拟合和模型欠拟合 过拟合Under Fitting(高方差high bias ) ----...

  • 吴恩达机器学习笔记(4)——正则化

    这章我们主要探讨的是在机器学习中过拟合的情况如何处理 过拟合 过拟合是机器学习中,计算机过度的为了达到目标,导致训...

  • 过拟合(Overfitting) 与 Dropout

    一、过拟合(Overfitting) Overfitting 也被称为过度学习,过度拟合。 它是机器学习中常见的问...

  • 机器学习之拟合、过拟合

    机器学习的基本问题是利用模型对数据进行拟合,学习的目的并非是对有限的训练集进行正确的预测,而是对未曾出现在训练集中...

  • 机器学习中的L0、L1、L2正则化

    过拟合 过拟合问题在机器学习中是一个经常遇到的问题,所谓过拟合,即模型过度地拟合了训练数据,从而导致模型在训练数据...

  • 学习曲线

    在机器学习中,模型的欠拟合和过拟合是需要格外注意的问题,同时也是经常发生的问题,其中过拟合最为常见. 欠拟合,即训...

  • TensorFlow-拟合

    过拟合overfitting 过于的拟合 拟合的结果 欠拟合 拟合完美 过度拟合 过度拟合的解决方法 减少数据 平...

网友评论

      本文标题:机器学习过拟合的解决方法

      本文链接:https://www.haomeiwen.com/subject/wvtzrqtx.html