这里我并不知道机器学习分为哪些东西。不过最开始接触到的是一个叫做(监督式)机器学习的东西,所以就从这里入手吧!
以下术语的解释并非官方的解释,而是我通过对这些名词的理解,作出的适合于我的方式。
1.什么是监督式的机器学习:
通过针对某种事物的学习,以达到对这件事物对了解,并且能够识别这种事物,并对事物做出处理。
例子:
- 学习识别数字,根据大量例子来获取识别经验,以达到即便出现例子中没有的数字,也能通过经验来进行识别。
- 学习分类垃圾邮件。
2.标签
标签就是上文所说的事物,比如识别物体、分类邮件、预测
房价之类的。
3.特征
特征就是我们平时说的那个特征,物体的特征,比如分类垃圾邮件,也许会有以下特征
- 电子邮件中的字词
- 发件人地址
- 发邮件的时段
- 电子邮件中包含的某些文字
当然特征不仅仅是这些东西,还有很多,对于一个复杂的标签,也许有数以万计的特征。
4.样本
样本就是例子,事物的例子,这些例子可以包含标签,也可以不包含标签。举例分类垃圾邮件的例子,样本可以是图片、文件、邮件等等杂七杂八的东西,其中的邮件也有可能是正常邮件和垃圾邮件,其中垃圾邮件包含某些特征,机器学习就是通过这些特征学会将垃圾邮件区分出来。但是需要注意的是,最开始的特征可能是人为提供的,但是在通过大量例子训练的时候,机器自己也会发现新的特征。
5.训练
用通俗的语言,我称之为发现经验的过程。
6.模型
模型就是机器学习过程中,机器发现事物和结果之间的关系,如果特征就是结果,那么就是特征与标签(事物)之间的关系,或许叫做经验。根据学习所获得的经验,对新对标签(事物)进行预测分析。
7.回归
回归就是通过经验判断趋势的这个行为,比如判断某个时候的物价可能是多少,主要体现在预测上
8.分类
回归如果说存在预测性,那么分类就是确定性的东西,比如判断某封邮件是否是垃圾邮件。回归和分类都是通过经验解决问题的行为。
网友评论