美文网首页ML&DL
ML&MLDS笔记:偏差 vs 方差

ML&MLDS笔记:偏差 vs 方差

作者: cherryleechen | 来源:发表于2019-05-08 09:56 被阅读8次

error来自哪?来自于偏差Bias和方差Variance。

图1 error的来源

就如打靶时瞄准一个点\overline{f},打出的点f^*分布在该点周围。那么,\overline{f}与实际靶心\hat{f}的距离就是偏差Bias,打出的点f^*\overline{f}的分布距离就是方差Variance。
可将偏差理解为没瞄准,方差理解为瞄准了但是打得太散。

图2 方差 vs 偏差

简单模型的方差小于复杂模型的方差。因为简单模型比较集中,其权重W不太会受到data变化的影响,可考虑极端例子f(x)=c,该模型方差为0。

图3 模型复杂度与方差

简单模型的偏差大于复杂模型的偏差。因为模型是个函数/假设集,定好模型后,function只能在里面挑选。而简单模型的space小,很可能不包含\hat{f};复杂模型的space大,很可能包含\hat{f}

图4 模型复杂度与偏差

偏差大意味欠拟合,方差大意味过拟合。

图5 欠拟合与过拟合

If your model cannot even fit the training examples, then you have large bias.
If you can fit the training data, but large error on testing data, then you probably have large variance.
For bias,redesign your model:

  • Add more features as input;
  • A more complex model.

For variance:

  • More data;
    Very effective, but not always practical.
    给的数据不够,很难准确地找到目标假设。但实际操作中,数据往往没那么“充足”。
  • Regularization.
    限制||W||,较小/短的W意味着函数较平滑:输入变化,输出变化小。
    may increase bias.

正则化可防止选模型时选出抖动得很厉害的模型。多数情况下,抖动得太厉害的function很可能不对。function中常数项bias对function是否平滑无影响。

图6 避免方差大的常见方法1
图7 避免方差大的常见方法2

模型选择就是在方差和偏差之间寻找平衡。
但以下做法不推荐:
用训练数据训练出不同模型后,根据这些模型在测试数据上的表现好坏进行模型选择选出所谓的最佳模型。
因为其偷看了测试数据,该最佳模型往往在real的测试数据上表现得不好。

图8 偷看测试数据

推荐使用交叉验证:
将训练数据分为训练数据和验证数据2部分,通过验证数据选择模型。
这时,在public测试数据上的表现和在private测试数据上的表现差不多。
原则上,越少根据public测试数据上的结果去调整模型,public测试数据和private测试数据上的表现相差越少。

图9 交叉验证

为降低偶然性,可使用N折交叉验证。

图10 N折交叉验证

相关文章

  • ML&MLDS笔记:偏差 vs 方差

    error来自哪?来自于偏差Bias和方差Variance。 就如打靶时瞄准一个点,打出的点分布在该点周围。那么,...

  • 机器学习相关问题

    Q1:偏差和方差 偏差:预测值与真实值的偏差方差:预测值的离散程度关系:此消彼涨 ​ 偏差大: 欠拟合, 问题:模...

  • 机器学习应用建议(二)

    偏差和方差的判别 高偏差和高方差本质上为学习模型的欠拟合和过拟合问题。 对于高偏差和高方差问题,即学习模型的欠拟合...

  • 方差偏差

    [高方差] 采集更多的样本数据[高方差] 减少特征数量,去除非主要的特征[高偏差] 引入更多的相关特征[高偏差] ...

  • 机器学习基础 | 偏差与方差

    一、什么是偏差和方差 在监督学习中,模型的泛化误差可分解为偏差、方差与噪声之和。 偏差与方差分别是用于衡量一个模型...

  • Bagging为什么能降低过拟合

    偏差与方差偏差 (bias) 定义为: 即模型的期望预测与真实值之间的差异。 方差 (variance) 定义为:...

  • 机器学习系列2:误差、梯度下降、交叉验证、归一化和评价指标

    一、详细理解误差(error)与偏差(bias)和方差(variance) 1.偏差与方差 2.error与bia...

  • ex5_偏差vs方差.md

    在这个练习中,您将实现正规化的线性回归,和用它来研究模型的 不同的偏差-方差 特性。 预测 水库的水位变化时,水流...

  • 偏差和方差

    1、在进行模型选择和评估时,我们经常会关注偏差和方差,那么什么是偏差?什么是方差? 偏差:描述的是预测值的期望与真...

  • 6. 偏差 - 方差权衡

    偏差 - 方差 学习曲线 偏差 - 方差 泛化与近似的权衡 Eout较小时,说明所提出的f与实际相比的近似度较高。...

网友评论

    本文标题:ML&MLDS笔记:偏差 vs 方差

    本文链接:https://www.haomeiwen.com/subject/ituonqtx.html