1.什么是有监督学习?
通过对输入的有标签样本进行学习,对无标签样本进行预测。
2.什么是学习?
通过组合输入信息的特征,找出特征和标签的内在联系。
3.什么是特征?
特征即输入变量。
简单的机器学习项目可能会使用单个特征,而比较复杂的机器学习项目可能会使用数百万个特征。
(如电子邮件文本中的字词,图像中的像素点等。)
4.什么是标签?
标签是我们要预测的结果。如股票的未来价格,图片中显示的动物品种等。
我们通常使用有标签样本训练模型,然后使用该模型来预测无标签样本的标签。
5.什么是样本?
样本是指输入数据的特定实例,包括有标签样本和无标签样本。
有标签样本同时包含特征和标签。
无标签样本包含特征,但不包含标签。
6.什么是模型?
模型定义了特征和标签之间的关系。
模型生命周期包括两个阶段:
训练:创建或学习模型。
推断:将训练后的模型用于无标签样本。
7.回归和分类。
回归模型可预测连续值。如一栋房子的价值是多少。
分类模型可预测离散值。如图像中的动物是猫还是狗。
注:逻辑斯特回归虽然名字中带有回归,但是是分类模型。
网友评论