西瓜书学习笔记 01-绪论

作者: dubian | 来源:发表于2018-09-20 00:16 被阅读0次

西瓜书学习笔记 01-绪论
西瓜书菜鸟学习笔记绪论
西瓜书学习笔记-绪论
西瓜书--绪论
《西瓜书》小记（一）绪论
机器学习西瓜书 Day01 绪论
机器学习笔记
机器学习笔记（1）
绪论学习笔记
机器学习基础(三): 模型评估与选择 - 方差与偏差

1.2 基础术语：

数据集： data set

示例： instance/sample

属性/特征：attribute/feature

属性值： attribute value

属性空间： attribute space

样本空间： sample space

特征向量： feature vector（所有属性/特征为坐标轴张成的向量空间，每个样本的属性值对应的空间向量称为“特征向量”）

样本空间和维数：

维数

训练数据： training data/ training instance，训练样本： training sample，训练集： training set

假设：hypothesis

真相/真实： ground-truth

学习器： learner

预测： prediction

标记： label

标记空间/输出空间： label space

样例： example（拥有标记的示例）

测试：testing，测试样本： testing sample

簇：cluster

泛化能力： generalization（学的的模型适用于新样本）

样本分布： distribution

独立同分布： independent and identically distribution（i.i.d.）

归纳：induction，归纳学习：inductive learning，演绎： deduction

泛化：generalization，特化：specialization

版本空间：version space

分类问题：classification（预测结果是离散的）

1. 二分类：binary classification（只涉及两个类别），正类：positive class，反类：negative class

2. 多分了： multi-class classification（涉及多个分类）

分类问题

回归问题： regression（预测结果是连续值）

聚类问题：clustering（将数据分成若干组/簇）

监督学习：supervised learning（训练数据有标记）- 分类，回归

无监督学习：unsupervised learning（训练数据无标记) - 聚类

1.3 假设空间：

1.4 归纳偏好：

NFL 理论

练习题

1.1 （色泽=*，根蒂= 蜷缩，声音 = *）（色泽= *, 根蒂= *，声音= 浊响）（色泽=清绿，根蒂= 蜷缩，声音 = 浊响）（色泽=清绿，根蒂= 蜷缩，声音 = *）（色泽=清绿，根蒂= *，声音 = 浊响）（色泽=清绿，根蒂= *，声音 = *）（色泽=*，根蒂= 蜷缩，声音 = 浊响）

1.2 这题有点牛逼，直接上网上找到的答案吧：https://blog.csdn.net/icefire_tyh/article/details/52065626

1.3 1. 丢掉矛盾的数据 2. 或者将矛盾的数据先剔除，先学习没有矛盾的数据，然后在用学得的模型预测矛盾的数据，再将矛盾的数据放回数据集进行学习

1.4

1.5 广告推送，汗