美文网首页
方差-偏差权衡

方差-偏差权衡

作者: wangke | 来源:发表于2018-04-07 10:30 被阅读37次

不要考虑测试数据, 只考虑训练数据.

模型的复杂度与拟合度

模型的复杂度对应了模型对训练集的拟合度, 模型越复杂, 拟合度越高.

对于训练误差(训练出的模型对训练集的预测):

  • 当模型复杂度低(图1.1)
    • 决策边界简单, 划分的同类点稠密, 方差低;
    • 训练集的实际值与真实值偏离大, 偏差高.
    • (欠拟合, 部分信息未被拟合)
  • 当模型复杂度高(图1.3)
    • 决策边界复杂, 划分的同类点稀疏, 方差高;
    • 训练集的实际值与真实值偏离小, 偏差低.
    • (过拟合, 拟合了噪声)
偏差-方差与模型复杂度
  • 横轴为(训练集拟合的)模型的复杂度, 纵轴为误差(褐色为训练数据的偏差, 青色为训练数据的方差, 黑色为测试误差. 训练误差与训练数据的偏差是一致的).
  • 随着模型的复杂度升高, (训练集)偏差逐步降低, (训练集)方差逐步升高; (测试集)测试误差先降低, 后升高.
  • Error = Bias^2 + Variance + noise (测试集误差 = 训练集偏差的平方 + 训练集方差 + 测试集噪声)
    • 当模型的复杂度较低时, 偏差占(测试)误差的主导地位, 需要降低偏差, 即增加模型的复杂度.
    • 当模型的复杂度较高时, 方差占(测试)误差的主导地位, 需要降低方差, 即降低模型的复杂度.


      偏差-方差的定义

圆盘上, 中心的红环对应着真实的值, 蓝色的点对应着预测的值.

  • 高方差, 低偏差意味着划分的同类点稀疏, 划分边界复杂, 模型过拟合训练集, 模型复杂度高.
    • 方差衡量了模型输出的离散程度.
  • 低方差, 高偏差意味着划分的同类点稠密, 划分边界简单, 模型欠拟合训练集, 模型复杂度低.
    • 偏差衡量了模型输出与真实值的偏离程度.

而我们期望的模型为图1.2, 图2中测试误差最小值, 即偏差-方差的权衡.

相关文章

  • 方差-偏差权衡

    不要考虑测试数据, 只考虑训练数据. 模型的复杂度对应了模型对训练集的拟合度, 模型越复杂, 拟合度越高. 对于训...

  • 6. 偏差 - 方差权衡

    偏差 - 方差 学习曲线 偏差 - 方差 泛化与近似的权衡 Eout较小时,说明所提出的f与实际相比的近似度较高。...

  • 机器学习笔记 第4课:偏差,方差和权衡

    经由偏差 - 方差的权衡,我们可以更好地理解机器学习算法。 偏差(bias)是模型所做的简化假设,其目的是更容易地...

  • 机器学习笔记 第4课:偏差,方差和权衡

    经由偏差 - 方差的权衡,我们可以更好地理解机器学习算法。 偏差(bias)是模型所做的简化假设,其目的是更容易地...

  • 回归模型度量_Chapter5

    应用预测建模第5章回归模型度量回归系数理解_方差偏差权衡[https://www.kaggle.com/xiuju...

  • 机器学习相关问题

    Q1:偏差和方差 偏差:预测值与真实值的偏差方差:预测值的离散程度关系:此消彼涨 ​ 偏差大: 欠拟合, 问题:模...

  • 机器学习应用建议(二)

    偏差和方差的判别 高偏差和高方差本质上为学习模型的欠拟合和过拟合问题。 对于高偏差和高方差问题,即学习模型的欠拟合...

  • 方差偏差

    [高方差] 采集更多的样本数据[高方差] 减少特征数量,去除非主要的特征[高偏差] 引入更多的相关特征[高偏差] ...

  • 机器学习基础 | 偏差与方差

    一、什么是偏差和方差 在监督学习中,模型的泛化误差可分解为偏差、方差与噪声之和。 偏差与方差分别是用于衡量一个模型...

  • Bagging为什么能降低过拟合

    偏差与方差偏差 (bias) 定义为: 即模型的期望预测与真实值之间的差异。 方差 (variance) 定义为:...

网友评论

      本文标题:方差-偏差权衡

      本文链接:https://www.haomeiwen.com/subject/ssnehftx.html