美文网首页
西瓜书学习笔记 01-绪论

西瓜书学习笔记 01-绪论

作者: dubian | 来源:发表于2018-09-20 00:16 被阅读0次

    1.2 基础术语:

    数据集: data set

    示例: instance/sample

    属性/特征:attribute/feature

    属性值: attribute value

    属性空间: attribute space

    样本空间: sample space

    特征向量: feature vector(所有 属性/特征 为坐标轴张成的向量空间,每个样本的属性值对应的空间向量称为“特征向量”)

    样本空间和维数:

    维数

    训练数据: training data/ training instance, 训练样本: training sample, 训练集: training set

    假设:hypothesis

    真相/真实: ground-truth

    学习器: learner

    预测: prediction

    标记: label

    标记空间/输出空间: label space

    样例: example(拥有标记的示例)

    测试:testing,测试样本: testing sample

    簇:cluster

    泛化能力: generalization(学的的模型适用于新样本)

    样本分布: distribution

    独立同分布: independent and identically distribution(i.i.d.

    归纳:induction,归纳学习:inductive learning, 演绎: deduction

    泛化:generalization, 特化:specialization

    版本空间:version space


    分类问题:classification(预测结果是离散的)

        1.  二分类:binary classification(只涉及两个类别), 正类:positive class, 反类:negative class

        2. 多分了: multi-class classification(涉及多个分类)

    分类问题

    回归问题: regression(预测结果是连续值)

    聚类问题:clustering(将数据分成若干组/簇)


    监督学习:supervised learning(训练数据有标记)- 分类, 回归

    无监督学习:unsupervised learning(训练数据无标记)  - 聚类


    1.3 假设空间:

    1.4 归纳偏好:

    NFL 理论

    练习题

    1.1 (色泽=*,根蒂= 蜷缩,声音 = *)(色泽= *, 根蒂= *,声音= 浊响)(色泽=清绿,根蒂= 蜷缩,声音 = 浊响)(色泽=清绿,根蒂= 蜷缩,声音 = *)(色泽=清绿,根蒂= *,声音 = 浊响)(色泽=清绿,根蒂= *,声音 = *)(色泽=*,根蒂= 蜷缩,声音 = 浊响)

    1.2 这题有点牛逼,直接上网上找到的答案吧:https://blog.csdn.net/icefire_tyh/article/details/52065626

    1.3  1. 丢掉矛盾的数据 2. 或者将矛盾的数据先剔除,先学习没有矛盾的数据,然后在用学得的模型预测矛盾的数据,再将矛盾的数据放回数据集进行学习

    1.4 

    1.5 广告推送,汗

    相关文章

      网友评论

          本文标题:西瓜书学习笔记 01-绪论

          本文链接:https://www.haomeiwen.com/subject/fmjfnftx.html