如果我们从我们的假设函数中过度拟合,我们可以通过增加其成本来减少函数中某些术语所带来的权重。
在优化问题上,我们需要尽量减少代价函数的均方误差,添加一些项加上 1000 乘以 θ3 的平方,加上 1000 乘以 θ4 的平方。

在末端增加两个部分。为了让成本函数接近于0,必须要减少至0,这会大大减少假设函数中
。因为超小项,粉色的新的曲线看起来像二次函数,更好地拟合数据。
我们还可以在一个总和中将所有theta参数规则化为(是常数项,一般不改变)

λ或λ是正则化参数。 它决定了我们的θ参数的成本被夸大了多少。使用上述成本函数和额外求和,我们可以平滑我们的假设函数的输出以减少过度拟合。 如果选择λ太大,它可能会使功能过度平滑并导致欠拟合。

网友评论