西瓜书学习笔记-绪论

作者: edwin1993 | 来源:发表于2018-04-25 09:30 被阅读16次

绪论

人类通过经验做出一些判断,在计算机系统中,经验一般以数据的形式存在。因此,机器学习所研究的主要内容是从数据中产生“模型”的算法,即学习算法。

从数据中学的模型的过程叫做学习或者训练,所学得的模型对应了数据的某种潜在规律。

1 基本概念
  • 学习类型
    我们所预测的结果是离散值,则这类学习任务称为分类。
    若预测的结果是连续值,则称为回归。
    根据训练数据是否有标记可分为:
    监督学习(有标记),代表是分类,回归。
    无监督学习(无标记),代表是聚类。

学习的目标是使得所学得的模型很好的适用于新样本,适应新样本的能力我们称为泛化能力。

  • 假设空间:
    假定有属性A、B、C,各自的取值有2种、3种、3种,则假设空间大小计算方式为:
    3 * 4 * 4 + 1
    因为取值中除了特定的值还包含通配符*,也就是说该数据取值任意。同时包括一个“空”。
    通过训练集数据对假设空间进行缩减,得到的称为版本空间。

  • 归纳偏好:
    归纳偏好可以看作是学习算法自身在一个庞大假设空间中对假设进行选择的启发式,如何没有归纳偏好,学习算法会被假设空间的等效假设所迷惑。

奥卡姆剃刀:若多个假设与观察一直,选择最简单的。

NFL定理:对于学习算法A,如果它在某些问题上表现的优于B,那么肯定在另一些问题上不如B

NFL定理说明:脱离了应用背景,讨论算法的优劣都是毫无意义的。

相关文章

  • 西瓜书 菜鸟学习笔记 绪论

    引言 机器学习研究的主要内容是关于在计算机上从数据中产生“模型”(model)的算法,即学习算法(learning...

  • 西瓜书学习笔记-绪论

    绪论 人类通过经验做出一些判断,在计算机系统中,经验一般以数据的形式存在。因此,机器学习所研究的主要内容是从数据中...

  • 西瓜书--绪论

    机器学习致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。在计算机系统中,”经验”通常以“数据”的形式存...

  • 西瓜书学习笔记 01-绪论

    1.2 基础术语: 数据集: data set 示例: instance/sample 属性/特征:attribu...

  • 《西瓜书》小记(一) 绪论

    简介 此章节以西瓜为主题介绍了一下机器学习的基本概念,如数据集、样本空间、特征向量等等,顺带介绍了一些机器学习的发...

  • 机器学习 西瓜书 Day01 绪论

    今天开始养成一个好的习惯培养意志力读书 《机器学习》 周志华著每天至少15页 Day01 p1-p22 第一章 绪...

  • 机器学习笔记

    以西瓜书为主线,以其他书籍作为参考进行补充,例如《统计学习方法》,《PRML》等 第一章 绪论 1.2 基本术语 ...

  • 机器学习笔记(1)

    机器学习笔记(1) 参考书:周志华《机器学习》 第1章 绪论 Part1 基本概念 1.机器学习的研究内容:如何从...

  • 绪论学习笔记

    一、为什么要学原理和公式推导学习笔记 1、“机器学习最直接的应用,就是利用模型解决实际业务中的问题”,第一...

  • 机器学习基础(三): 模型评估与选择 - 方差与偏差

    前言 本笔记是笔者学习西瓜书所做笔记,转载请附本文链接及作者信息。 有问题欢迎在交流区探讨学习,QQ:761322...

网友评论

    本文标题:西瓜书学习笔记-绪论

    本文链接:https://www.haomeiwen.com/subject/ekqvkftx.html