美文网首页秋招-算法
模型方差与偏差

模型方差与偏差

作者: 0过把火0 | 来源:发表于2018-10-17 16:37 被阅读3次

面试过程中经常会被问到关于方差和偏差的概念以及比对。

偏差

偏差度量了学习算法的期望预测值与真实结果间的偏离程度,也就是刻画了模型本身的拟合能力,也就是偏差越大,意味着预测值越偏离真实数据。


高偏差

最直观的感受就是,如果训练误差很大,测试误差与训练误差相当,那么此时表明模型对训练数据的拟合并不是很好,这就是高偏差。

方差

方差刻画了同样大小训练集的变动所导致的学习性能的变化,即刻画了数据扰动所造成的影响。说白了就是对预测值方差的描述,方差越大,则数据的分布越分散。


高方差

如果训练误差远高于测试误差,那么说明模型过拟合,此时表明模型的方差较高;

上述所指的模型误差是相对的,例如,人类肉眼识别猫狗的误差若在0.5%左右的话,那么我们的模型误差在其附近是合理的,因此,对于这种相对的误差而言,将其称作是先验知识,也就是贝叶斯误差。

偏差方差不可同求

偏差和方差不能同时满足。

在模型训练初期,由于迭代轮数较小,此时算法未能完全学习到训练集数据的内容,因此,此时模型的泛华错误率主要来自偏差,而随着轮数不断加深,算法完全拟合了训练集,学习到了训练集数据的波动规律,此时主要泛化错误率来自于方差。而再随着迭代的加深,训练数据的非全局性,非代表性的规律被学习到后,此时发生一点数据波动,模型都会被严重影响,此时可能发生了过拟合。

噪声

刻画了任何一种学习算法在该数据集上所能达到的期望泛化误差的下界,也就是刻画了学习问题本身的难度。

泛化性能与上述指标的关系

其实上述是指标共同构成的是泛化性能的大小,也就是说,泛化性能是由该算法的能力、数据的好坏以及学习任务本身的难度所共同决定的。给定一个学习任务,为了取得较好的泛化性能,需使得偏差较小,即能够充分拟合数据,同时要使得方差较小,也就是数据扰动带来的影响尽量小。

https://www.jianshu.com/p/ed9abdb0c867

相关文章

  • 机器学习基础 | 偏差与方差

    一、什么是偏差和方差 在监督学习中,模型的泛化误差可分解为偏差、方差与噪声之和。 偏差与方差分别是用于衡量一个模型...

  • Bagging为什么能降低过拟合

    偏差与方差偏差 (bias) 定义为: 即模型的期望预测与真实值之间的差异。 方差 (variance) 定义为:...

  • 模型方差与偏差

    序 面试过程中经常会被问到关于方差和偏差的概念以及比对。 偏差 偏差度量了学习算法的期望预测值与真实结果间的偏离程...

  • 机器学习应用建议(二)

    偏差和方差的判别 高偏差和高方差本质上为学习模型的欠拟合和过拟合问题。 对于高偏差和高方差问题,即学习模型的欠拟合...

  • 偏差和方差

    1、在进行模型选择和评估时,我们经常会关注偏差和方差,那么什么是偏差?什么是方差? 偏差:描述的是预测值的期望与真...

  • 集成学习(1)模型误差与集成学习

    1 模型误差——偏差与方差 之前我们已经说了不少模型,这些模型的特点是:1、都是有监督模型;2、都是个体模型,基本...

  • bagging,boosting的方差和偏差

    参考文章协方差 百度百科bagging与boosting两种集成模型的偏差bias以及方差variance 的理解...

  • 机器学习系列2:误差、梯度下降、交叉验证、归一化和评价指标

    一、详细理解误差(error)与偏差(bias)和方差(variance) 1.偏差与方差 2.error与bia...

  • 机器学习作业5-偏差和方差

    基于偏差和方差的优化 模型训练完成,怎么直观的观察模型的好坏呢?观察训练集的方差和交叉验证的方差,可以大致判断是欠...

  • XGBoost算法思想

    本章涉及到的知识点清单:1、boosting模式2、集成学习模型的偏差和方差3、bagging的偏差和方差4、bo...

网友评论

    本文标题:模型方差与偏差

    本文链接:https://www.haomeiwen.com/subject/qksrzftx.html