美文网首页
偏差和方差

偏差和方差

作者: 快乐的小飞熊 | 来源:发表于2017-03-12 11:42 被阅读0次

1、在进行模型选择和评估时,我们经常会关注偏差和方差,那么什么是偏差?什么是方差?

偏差:描述的是预测值的期望与真实值之间的差距。偏差越大,越偏离真实数据。偏差也叫拟合能力。
方差:描述的是预测值的变化范围,离散程度,也就是离其期望值的距离。方差越大,数据的分布越分散。度量了同样大小的训练集的变动所导致的学习性能的变化,即刻画了数据扰动造成的影响。

由下图可以看出来,偏差大就是与真实值的差距大,高方差跟真实值没什么关系,只是预测值是否密集在一起,如果分散,就是方差大。


注意:

Bias:误差,拟合出来的对象是单个模型,期望输出与真实标记的差别

Variance:方差,拟合对象是多个模型,从同一个数据集中,用科学的采样方法得到几个不同的子训练集,用这些训练集训练得到的模型往往并不相同。蓝色和绿色分别是同一个训练集上采样得到的两个训练子集,由于采取了复杂的算法去拟合,两个模型差异很大。如果是拿直线拟合的话,显然差异不会这么大。

Paste_Image.png

2、方差与偏差trade-off


当模型复杂度逐渐增强的时候,偏差是逐渐减小的,方差逐渐增大,它们中间有一个交点,就是两者达到平衡,在适当的模型复杂度下,对训练数据有一个良好的拟合,而且泛化性能也不差。

2、对于高偏差和高方差的情况应该如何处理?

下图是NG机器学习课的一个截图:



解释:
(1)增加训练样本可以减小方差,以为随着样本量的增加,泛化性能会好一些,验证损失会Jcv逐渐减小,所以会减小方差
(2)取少量的特征,可以有效的防止过拟合,提高泛化性能,会减小方差。
(3)取更多的特征,能从更多的角度学习数据的分布,减小训练loss,会减小偏差。
(4)增加多项式特征,增加了模型的复杂度,可以降低偏差。
(5)减小lambda:就是削弱正则的作用,增加模型复杂度,减小偏差
(6)增大lambda:增强正则的作用,对参数进行有效控制,防止过拟合,减小方差。

注意:
这里应该学会的是,对症下药,我们通过观察学习曲线,可以知道是偏差大了还是方差大了,从而进行解决方案的选取。选取不当的话,不会产生任何优化,比如说:如果偏差较大的话,增加训练样本的个数是没用的,必须采取其他有效的方法,可以增加特征,增加多项式,减小lambda等。

参考文章
http://www.cnblogs.com/zhizhan/p/5002455.html
https://www.zhihu.com/question/20448464

相关文章

  • 机器学习应用建议(二)

    偏差和方差的判别 高偏差和高方差本质上为学习模型的欠拟合和过拟合问题。 对于高偏差和高方差问题,即学习模型的欠拟合...

  • 偏差和方差

    简历

  • 方差和偏差

    博客:http://liuchengxu.org/blog-cn/posts/bias-variance/ 误差一...

  • 偏差和方差

    偏差度量的是函数或者参数的误差期望。对于机器学习,偏差意味着样本的输出与真实值之间的误差,即模型本身的精确程度。 ...

  • 偏差和方差

    1、在进行模型选择和评估时,我们经常会关注偏差和方差,那么什么是偏差?什么是方差? 偏差:描述的是预测值的期望与真...

  • 机器学习相关问题

    Q1:偏差和方差 偏差:预测值与真实值的偏差方差:预测值的离散程度关系:此消彼涨 ​ 偏差大: 欠拟合, 问题:模...

  • 机器学习系列2:误差、梯度下降、交叉验证、归一化和评价指标

    一、详细理解误差(error)与偏差(bias)和方差(variance) 1.偏差与方差 2.error与bia...

  • 机器学习基础 | 偏差与方差

    一、什么是偏差和方差 在监督学习中,模型的泛化误差可分解为偏差、方差与噪声之和。 偏差与方差分别是用于衡量一个模型...

  • XGBoost算法思想

    本章涉及到的知识点清单:1、boosting模式2、集成学习模型的偏差和方差3、bagging的偏差和方差4、bo...

  • Machine Learning (2)

    理解偏差和方差 学习误差为什么是偏差和方差而产生的,并且推导数学公式 过拟合,欠拟合,分别对应 bias 和 va...

网友评论

      本文标题:偏差和方差

      本文链接:https://www.haomeiwen.com/subject/ljgawttx.html