书名:计算机视觉40例从入门到深度学习:OpenCV-Python
作者:李立宗
出版社:电子工业出版社
出版时间:2022-07-01
ISBN:9787121436857
第15章 机器学习导读
15.2 机器学习基础概念
15.2.1 机器学习的类型
二、无监督学习
1、定义
- 无监督学习是指没有监督的学习。
简单地说,在无监督学习中只有数据,数据没有明确含义,或者说数据没有对应的标签。
无监督学习就是需要对抽象的数据进行学习,并从中找到规律。 - 一般来说,无监督学习有两种应用:
一种是分类,
另一种是异常检测。
2、典型应用——分类
-
处理数字的最简单方式就是分类。
分组示例如图15-5所示,按照数值的大小,将数值划分到不同的组内。
分组后不同组有不同含义。
图15-5 分组示例 -
不过需要注意的是,在机器学习中通常不直接对数据进行分组,而是对原始数据进行一定的处理后,再进行分组。
或者说,原始数据是无法直接分组的,将数据映射到一个新的空间后,才可以对数据进行分组,如图15-6所示。
图15-6 映射分组示意图
3、分类的好处
- 分类能够帮助我们简化问题。
例如,可以将年龄划分为少年、青年、中年、老年四组,分组后的数据与介于[0,100]的众多原始数据相比少了很多。
在处理用户画像等场合,通常采用该方法。 - 分类能够帮助我们完成数据压缩。
例如,灰度图像需要256个灰度级,对应像素值为[0,255],计算机需要用8个二进制位表示一个像素。若对图像质量要求不高,则可以根据需要将像素点划分为纯黑和纯白两组,分别用0和1表示,这样只用一个二进制位就能表示一个像素点的颜色。采用这种方式,数据的压缩比为8:1。 - 分类有利于可视化。
例如,图15-6中的数据原本是混在一起的,分类后我们更容易观察到数据的分布及关系等。
4、典型应用——异常检测
-
无监督学习在异常检测方面的应用有信用卡异常监测、缺陷检测、异常数据处理等。
如图15-7所示,机器学习掌握了正常数据(圆形数据)的特征,在遇到新的五角星数据时,它会准确地将数据A处理为异常,将数据B处理为正常。
图15-7 异常检测示意图
5、无监督学习算法
比较重要的无监督学习有
- K均值聚类、
- 可视化和降维、
- 主成分分析(PCA)、
- 单分类支持向量机(One-class SVM)、
- 关联规则学习。
网友评论