美文网首页
四种机器学习曲线

四种机器学习曲线

作者: 小小orange | 来源:发表于2018-11-22 14:27 被阅读0次

一、方差、偏差与欠拟合、过拟合概念

        1.方差:描述模型对于给定值的输出稳定性.。(强调个体结果与个体期望的远近)

        2.偏差:描述模型输出结果的期望与样本真实结果的差距。(强调整体结果与期望的远近 )

        3.欠拟合:模型不够复杂或者训练数据过少时,模型均无法捕捉训练数据的基本(或者内在)关                              系,会出现偏差。这样一来,模型一直会错误地预测数据,从而导致准确率降低。                            这种现象称之为模型欠拟合。

        4.过拟合:模型过于复杂或者没有足够的数据支持模型的训练时,模型含有训练集的特有信                              息,对训练集过于依赖,即模型会对训练集高度敏感,这种现象称之为模型过拟合。

         注:高方差->过拟合;高偏差->欠拟合

二、类比靶向图

偏差VS方差

左上角表示(低偏差,低方差),这是最理想的状况;

右上角表示(低偏差,高方差),低偏差导致预测结果与真实结果很近,高方差导致个体预测结果不稳定,比较不集中;

左下角表示(高偏差,低方差),高偏差导致预测结果与真实结果很远,低方差导致个体预测结果稳定,比较集中;

右下角表示(高偏差,高方差),高偏差导致预测结果与真实结果很远,高方差导致个体预测结果不稳定,比较不集中;

三、学习曲线

偏差VS方差

左上角是最优情况,随着样本的增加,train error虽然有一定的增加吗,但是 test error却有很明显的降低;

右上角是最差情况,train error很大,模型并没有从特征中学习到什么,导致test error非常大,模型几乎无法预测数据,需要去寻找数据本身和训练阶段的原因;

左下角是high variance的情况,train error虽然较低,但是模型产生了过拟合,缺乏泛化能力,导致test error很高;

右下角是high bias的情况,train error很高,这时需要去调整模型的参数,减小train error。

相关文章

  • 四种机器学习曲线

    一、方差、偏差与欠拟合、过拟合概念 1.方差:描述模型对于给定值的输出稳定性.。(强调个体结果与个体期望的...

  • sklearn调包侠之学习曲线和Pipeline

    今天不单独讲解某个机器学习算法,而是讲解机器学习中常用的工具或者说是方法。一是绘制学习曲线,看模型的好坏程度(过拟...

  • 机器学习入门指南

    前段时间微软的年龄识别网站风靡全球,它的核心算法就是机器学习领域的内容。机器学习看起来高深莫测,学习曲线比较陡,实...

  • 哲哲的ML笔记(二十一:学习曲线)

    学习曲线的含义 学习曲线就是一种很好的工具,我经常使用学习曲线来判断某一个学习算法是否处于偏差、方差问题。学习曲线...

  • 297个机器学习彩图知识点(6)

    导读 本系列将持续更新20个机器学习的知识点。 1. Leaky ReLU 2. 学习曲线 3. 学习 4. 学习...

  • 用学习曲线 learning curve 来判别过拟合问题

    本文结构: 学习曲线是什么? 怎么解读? 怎么画? 学习曲线是什么? 学习曲线就是通过画出不同训练集大小时训练集和...

  • 学Python必看!今年最火的五大Python框架

    由于简单的学习曲线、越来越快的应用程序以及机器学习辅助功能等附加优势,Python已经成了IT行业的流行词… 由于...

  • 机器学习笔记一

    Type of machine learning 机器学习的四种类型 Supervised Learning 监督...

  • 如何用学习曲线降低偏差和方差?

    摘要:如何判断偏差和方差?我们应该如何降低误差?本文将就这两个问题探讨如何使用学习曲线降低这两个主要误差。 机器学...

  • 机器学习算法的性能评估

    本文介绍机器学习算法的性能评估的方法,包括算法高偏差还是高方差的诊断,学习曲线等。从工程应用的角度来讲,算法只需要...

网友评论

      本文标题:四种机器学习曲线

      本文链接:https://www.haomeiwen.com/subject/anzkqqtx.html