1.2 基础术语:
数据集: data set
示例: instance/sample
属性/特征:attribute/feature
属性值: attribute value
属性空间: attribute space
样本空间: sample space
特征向量: feature vector(所有 属性/特征 为坐标轴张成的向量空间,每个样本的属性值对应的空间向量称为“特征向量”)
样本空间和维数:
维数训练数据: training data/ training instance, 训练样本: training sample, 训练集: training set
假设:hypothesis
真相/真实: ground-truth
学习器: learner
预测: prediction
标记: label
标记空间/输出空间: label space
样例: example(拥有标记的示例)
测试:testing,测试样本: testing sample
簇:cluster
泛化能力: generalization(学的的模型适用于新样本)
样本分布: distribution
独立同分布: independent and identically distribution(i.i.d.)
归纳:induction,归纳学习:inductive learning, 演绎: deduction
泛化:generalization, 特化:specialization
版本空间:version space
分类问题:classification(预测结果是离散的)
1. 二分类:binary classification(只涉及两个类别), 正类:positive class, 反类:negative class
2. 多分了: multi-class classification(涉及多个分类)
分类问题回归问题: regression(预测结果是连续值)
聚类问题:clustering(将数据分成若干组/簇)
监督学习:supervised learning(训练数据有标记)- 分类, 回归
无监督学习:unsupervised learning(训练数据无标记) - 聚类
1.3 假设空间:
1.4 归纳偏好:
NFL 理论练习题
1.1 (色泽=*,根蒂= 蜷缩,声音 = *)(色泽= *, 根蒂= *,声音= 浊响)(色泽=清绿,根蒂= 蜷缩,声音 = 浊响)(色泽=清绿,根蒂= 蜷缩,声音 = *)(色泽=清绿,根蒂= *,声音 = 浊响)(色泽=清绿,根蒂= *,声音 = *)(色泽=*,根蒂= 蜷缩,声音 = 浊响)
1.2 这题有点牛逼,直接上网上找到的答案吧:https://blog.csdn.net/icefire_tyh/article/details/52065626
1.3 1. 丢掉矛盾的数据 2. 或者将矛盾的数据先剔除,先学习没有矛盾的数据,然后在用学得的模型预测矛盾的数据,再将矛盾的数据放回数据集进行学习
1.4
1.5 广告推送,汗
网友评论