美文网首页
机器学习评估方法

机器学习评估方法

作者: 茄子cheer | 来源:发表于2018-03-14 17:00 被阅读0次

机器学习的目的是产生泛化能力好的模型,那么什么样的模型才是泛化能力好的模型呢,这需要按照一定的评估方法和度量指标去衡量。

机器学习的评估方法

一般情况下,我们手头没有未知样本。我们需要一个测试集测试模型对 新样本的判别能力。以测试集的测试误差作为泛化误差的近似。测试集的选取一般采用以下三种方法:留出法、交叉验证法、自助法。

1、留出法

留出法直接将数据集划分为两个互斥的集合。

注意点:要保持数据分布的一致性;采用多次随机划分取均值的评估方法;测试集的比例应该适当(1/3~1/5)

2、交叉验证法

将数据集平均分成k份,并尽量保证每份数据分布一致。依次用其中k-1份作为训练集,剩下的一份作为测试集。这样就有k组训练集/测试集,从而可以进行k次训练和测试,返回k次测试结果的均值,也称为“k折交叉验证法”。

10折交叉验证

若令k=m,则称为“留一法”

3、自助法

在留出法和交叉验证法中,由于只采用了一部分样本用于训练,因此会引入一些因为样本规模不足而引入的偏差,而留一法的算法复杂度又太高。自助法可以解决这个问题。

假将样本集记为D,D中共有m个样本。对D进行有放回抽样m次,得到包含m个样本的训练集D'。而未被采样到的样本集合(D-D')作为测试集。按照概率,样本每次不被抽到的概率是(1-1/m),在m次采样中,始终不被抽到的概率为

样本始终不被抽到的概率

即,通过自助抽样,样本中约有36.8%的数据不被抽到,用于测试,称为“包外测试”。

自助法改变了数据分布,会引入估计偏差,一般只在 数据集较小的情况下采用。

相关文章

  • 机器学习评估方法

    机器学习的目的是产生泛化能力好的模型,那么什么样的模型才是泛化能力好的模型呢,这需要按照一定的评估方法和度量指标去...

  • 机器学习——评估方法

    留出法 将数据集 D 拆分为 训练集 S 和测试集 T 正常来说会保留 70% 用作训练,30% 用作测试。采样时...

  • 大师兄的Python机器学习笔记:数据重抽样

    大师兄的Python机器学习笔记:数据预处理大师兄的Python机器学习笔记:实现评估模型 一、重抽样方法 1. ...

  • 2018-03-13

    ## 机器学习评估系统 机器学习(ML),自然语言处理(NLP),信息检索(IR)等领域,评估(Evaluatio...

  • 机器学习(深度学习)常见面试题--基础知识篇

    1. 模型评估 在机器学习领域,模型评估至关重要,只有选择和问题相匹配的评估方法,才能更快更好的完成训练。将模型评...

  • Spark机器学习笔记

    Spark机器学习笔记 机器学习 机器学习是数据通过算法构建出模型并对模型进行评估,评估的性能如果达到要求就拿这个...

  • 【百面机器学习-模型评估】

    为什么需要模型评估? 在计算机科学特征时机器学习领域中,对模型的评估至关重要。只有选择与问题相匹配的评估方法...

  • 机器学习概述与算法介绍(二)

    机器学习概述 机器学习基本概念 机器学习基本流程与工作环节 机器学习中的评估指标 机器学习算法一览 3. 机器学习...

  • Lesson 13 - 多元线性回归

    概括 理解多重线性回归的应用 , 潜在问题和评估模型拟合的方法 , 是更复杂机器学习方法的核心 学习了如何在Pyt...

  • 误差与评估方法

    机器学习误差: 训练误差或者经验误差:学习器在训练集上的误差 泛化误差:在新样本上的误差 评估方法: ...

网友评论

      本文标题:机器学习评估方法

      本文链接:https://www.haomeiwen.com/subject/xvpfqftx.html