美文网首页机器学习
过拟合的问题

过拟合的问题

作者: 东京的雨不会淋湿首尔 | 来源:发表于2019-03-05 19:28 被阅读0次
    下图是一个回归问题的例子: image.png

    第一个模型是一个线性模型,欠拟合,不能很好地适应我们的训练集;第三个模型是一个四次方的模型,过于强调拟合原始数据,而丢失了算法的本质:预测新数据。我们可以看出,若给出一个新的值使之预测,它将表现的很差,是过拟合,虽然能非常好地适应我们的训练集但在新输入变量进行预测时可能会效果不好;而中间的模型似乎最合适。

    如果我们发现了过拟合问题,应该如何处理?

    1.丢弃一些不能帮助我们正确预测的特征。可以是手工选择保留哪些特征,或者使用一些模型选择的算法来帮忙(例如PCA)

    2.正则化。 保留所有的特征,但是减少参数的大小(magnitude)

    相关文章

      网友评论

        本文标题:过拟合的问题

        本文链接:https://www.haomeiwen.com/subject/vtxouqtx.html