书名:计算机视觉40例从入门到深度学习:OpenCV-Python
作者:李立宗
出版社:电子工业出版社
出版时间:2022-07-01
ISBN:9787121436857
第15章 机器学习导读
15.2 机器学习基础概念
15.2.4 模型的拟合
一、拟合定义
- 拟合
是指用训练数据构造一个表达式,该表达式的曲线与训练数据及测试数据的分布基本一致。 - 在机器学习中,拟合是指根据已知数据构造一个模型,该模型能够预测测试数据。
二、欠拟合和过拟合
-
在具体实现时,可能会产生欠拟合和过拟合。
图15-15显示了拟合的不同情况,图中的实心圆点是训练数据,空心圆点是测试数据(未知数据)。
图15-15 拟合的不同情况 -
左图:
对应一个二次函数(y=a(x-b)2+c),是拟合良好状态,表达式对应的曲线与训练数据分布大致一致,能够用来预测未知数据。 -
中间图:
对应一个一次函数(y=kx+b),是欠拟合状态,表达式对应的曲线只能与训练数据中的部分数据的分布一致。
这说明,在学习时没有完整地把握训练数据的规律;此时,曲线不能拟合训练数据的大致分布,更不能用来计算未知数据。 -
右图:
对应一个高次函数(y=ax9+bx8+cx7+dx6+ex5+fx4+gx3+hx2+ix+j),是过拟合状态,表达式对应的曲线精准地与所有训练数据分布一致,导致泛化性能下降。
此时,曲线能高度精准地拟合训练集,但对测试集的预测能力较差。
三、示例
例如,甲、乙、丙都通过一段演唱会的录音来学习歌手L的歌。再唱一首L的新歌时,他们的表现不太一样。
- 甲:唱风很像L,是拟合良好状态。
- 乙:唱风只有一点像L,是欠拟合状态。
- 丙:像L在开演唱会,不仅有歌声,还夹杂着听众的喝彩、尖叫,是过拟合状态。
网友评论