美文网首页
14-过拟合和欠拟合

14-过拟合和欠拟合

作者: jxvl假装 | 来源:发表于2019-10-01 14:49 被阅读0次

    过拟合和欠拟合的概念

    **欠拟合和过拟合**
    在这里插入图片描述
    模型复杂的原因:数据的特征和目标值之间的关系不仅仅是线性关系

    欠拟合的原因:学习到数据的特征过少
    解决办法:增加数据的特征数量

    过拟合的原因:原始特征过多,存在一些嘈杂特征,模型过于复杂是因为模型尝试去兼顾各个测试数据点
    解决办法:

    1. 进行特征选择,消除关联性大的特征(很难做)
    2. 进行交叉验证(进行检验,而不是消除。让所有数据都有过训练)
    3. 正则化

    根据结果现象来判断过拟合和欠拟合

    • 交叉验证
      • 训练集结果欠拟合表现不行;过拟合表现好
      • 测试集:欠拟合表现不行;过拟合表现不行

    回归解决过拟合:L2正则化

    作用:可以使得W的每个元素(特征值的权重)都很小,都接近于0,通过调试,使得某些特征的w(权重,即系数)特别小,从而简化减小其对模型的影响,消除过拟合

    优点:越小的参数说明模型越简单,越简单的模型则越不
    容易产生过拟合现象

    L2正则化:Ridge:岭回归 带有正则化的线性回归 解决过拟合

    相关文章

      网友评论

          本文标题:14-过拟合和欠拟合

          本文链接:https://www.haomeiwen.com/subject/uhluuctx.html