偏差和方差

作者: 西风酹江月 | 来源:发表于2017-06-06 19:30 被阅读94次
  • 偏差度量的是函数或者参数的误差期望。对于机器学习,偏差意味着样本的输出与真实值之间的误差,即模型本身的精确程度。
  • 方差度量的是数据上任意特定采样导致的估计期望的偏差。方差代表的是一次训练中一次输出结果和模型输出期望之间的误差,即模型的稳定性。

过拟合会出现高方差问题,此时模型在训练集上错误率极低,但是在测试集上表现很差,模型把训练集里面的噪声都当成了真实的数据分布特征,导致泛化性能不好。
欠拟合会出现高偏差的问题。此时,训练样本太少,导致模型不足以刻画数据分布,表现在训练集上都会出现较高的错误率。

image.png

下图中用了三个模型来拟合训练集的样本。训练数据是随机生成的x,y,左图用了一个线性模型导致结果欠拟合——它无法捕捉数据中的曲率信息。中图采用了二次模型,很好反映了数据中的二次关系,且在测试集上表现良好。右图采用了9阶多项式模型,虽然得出的解可以精确地穿过每一个训练数据点,但是很显然,模型得到了一个数据集上实际并不存在的深谷,拟合曲线急剧的变化,往往意味着过拟合的产生。在测试数据集上通常不会有好的表现。

image.png

提高机器学习模型泛化能力的思想可以追溯到托勒密时代的哲学思想,现在通常被简称为奥卡姆剃刀(Occams‘s razor)。该原则指出,在同样能够解释一直观测现象的假设中,我们应该挑选最简单的哪一个。
如何避免过拟合和欠拟合?
避免欠拟合:
1)寻找更好的特征,具有代表性;
2)用更多的特征,增大输入向量的维度
避免过拟合:
1)增大数据集合 - 使用更多的数据,噪声的比重减少

image.png
2)减少数据特征 - 减少数据维度
3)正则化方法 - 增加正则项
4)交叉验证的方法
参考文献:
1、深度学习 https://github.com/exacity/deeplearningbook-chinese
2、http://scott.fortmann-roe.com/docs/BiasVariance.html

相关文章

  • 机器学习应用建议(二)

    偏差和方差的判别 高偏差和高方差本质上为学习模型的欠拟合和过拟合问题。 对于高偏差和高方差问题,即学习模型的欠拟合...

  • 偏差和方差

    简历

  • 方差和偏差

    博客:http://liuchengxu.org/blog-cn/posts/bias-variance/ 误差一...

  • 偏差和方差

    偏差度量的是函数或者参数的误差期望。对于机器学习,偏差意味着样本的输出与真实值之间的误差,即模型本身的精确程度。 ...

  • 偏差和方差

    1、在进行模型选择和评估时,我们经常会关注偏差和方差,那么什么是偏差?什么是方差? 偏差:描述的是预测值的期望与真...

  • 机器学习相关问题

    Q1:偏差和方差 偏差:预测值与真实值的偏差方差:预测值的离散程度关系:此消彼涨 ​ 偏差大: 欠拟合, 问题:模...

  • 机器学习系列2:误差、梯度下降、交叉验证、归一化和评价指标

    一、详细理解误差(error)与偏差(bias)和方差(variance) 1.偏差与方差 2.error与bia...

  • 机器学习基础 | 偏差与方差

    一、什么是偏差和方差 在监督学习中,模型的泛化误差可分解为偏差、方差与噪声之和。 偏差与方差分别是用于衡量一个模型...

  • XGBoost算法思想

    本章涉及到的知识点清单:1、boosting模式2、集成学习模型的偏差和方差3、bagging的偏差和方差4、bo...

  • Machine Learning (2)

    理解偏差和方差 学习误差为什么是偏差和方差而产生的,并且推导数学公式 过拟合,欠拟合,分别对应 bias 和 va...

网友评论

    本文标题:偏差和方差

    本文链接:https://www.haomeiwen.com/subject/nliufxtx.html