美文网首页
过拟合 & 数据集不平衡

过拟合 & 数据集不平衡

作者: MapleLuv | 来源:发表于2018-07-02 15:53 被阅读0次

    过拟合

    1. 什么是过拟合?
       过拟合(Overfit),是这样一种现象:一个假设在训练数据上能够获得比其他假设更好的拟合,但是在训练数据外的数据集 上却不能很好的拟合数据。此时我们就叫这个假设出现了overfit的现象。

    2. 原因:

      • 模型复杂度过强(参数多并且过训练)
      • 数据中的噪声
      • 数据量有限,模型无法真正了解数据的真实分布。
    3. 解决:

      • 权制衰减
      • 适当stopping criterion(验证集)?
      • 正则化?

    数据集不平衡

    不平衡训练集会对结果造成很大的负面影响,而训练集在平衡的情况下,能够达到最好的performance。

    1. 训练数据分布情况对CNN结果产生很大影响;
    2. 平衡的训练集是最优的,数据越不平衡,准确率越差;
    3. 如何提升准确率(使用Oversampling

    参考链接

    相关文章

      网友评论

          本文标题:过拟合 & 数据集不平衡

          本文链接:https://www.haomeiwen.com/subject/jgpkuftx.html