过拟合问题

过拟合问题

作者: JaiUnChat | 来源:发表于2017-01-18 23:17 被阅读329次

下面三幅图显示了对同一组数据取不同的特征值进行拟合的结果。

拟合程度

左边的是欠拟合。数据并不能十分恰当的落在直线上。
中间的是合理状态。数据基本落在了求出的直线上。
右边的是过拟合。数据完美的落在了描绘的曲线上，这样会导致拟合出来的曲线不能泛化到需要预测的问题中，从而导致误差。

拟合问题是线性回归和逻辑回归中都存在的问题。下面是两种常见的解决方法:

减少特征数量:

手动选择特征的去留。
使用模型选择算法。

正则化 Regularization

保留所有特征，但是减少某一个参数θ_j的重要性。
当有许多有用的特征时，正规化将会非常有用。

1.正规化代价方程

比如我们有如下的参数，进行梯度下降的时候，发现了过拟合。

并不采取消除高次项的措施，而是将代价函数作如下修改。

在需要降低重要性的参数前，加上一个较大值。

也可以对所有的参数都进行正则化。

选取过大的λ会使得曲线过于光滑导致欠拟合，一般都可以先将λ参数选在1000左右。

原代价函数

正则化后的代价函数

2.正则化的梯度下降

同样对上述代价函数进行梯度下降，公式如下所示。

通常不对x₀进行正则化

3.正规方程 Normal Equaltion

L就是将常数λ矩阵化，也就是除了x₀外的单位矩阵
必须保证训练集数m>=参数数n，否则X^TX不可逆，即X^TX + λ⋅L 不可逆。

相关文章

网友评论

本文标题：过拟合问题

本文链接：https://www.haomeiwen.com/subject/agbbbttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|过拟合问题|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！