美文网首页
无监督学习

无监督学习

作者: 大龙10 | 来源:发表于2023-11-25 05:04 被阅读0次

    书名:计算机视觉40例从入门到深度学习:OpenCV-Python
    作者:李立宗
    出版社:电子工业出版社
    出版时间:2022-07-01
    ISBN:9787121436857


    第15章 机器学习导读

    15.2 机器学习基础概念

    15.2.1 机器学习的类型

    二、无监督学习

    1、定义
    • 无监督学习是指没有监督的学习。
      简单地说,在无监督学习中只有数据,数据没有明确含义,或者说数据没有对应的标签。
      无监督学习就是需要对抽象的数据进行学习,并从中找到规律。
    • 一般来说,无监督学习有两种应用:
      一种是分类,
      另一种是异常检测。
    2、典型应用——分类
    • 处理数字的最简单方式就是分类。
      分组示例如图15-5所示,按照数值的大小,将数值划分到不同的组内。
      分组后不同组有不同含义。


      图15-5 分组示例
    • 不过需要注意的是,在机器学习中通常不直接对数据进行分组,而是对原始数据进行一定的处理后,再进行分组。
      或者说,原始数据是无法直接分组的,将数据映射到一个新的空间后,才可以对数据进行分组,如图15-6所示。


      图15-6 映射分组示意图
    3、分类的好处
    • 分类能够帮助我们简化问题。
      例如,可以将年龄划分为少年、青年、中年、老年四组,分组后的数据与介于[0,100]的众多原始数据相比少了很多。
      在处理用户画像等场合,通常采用该方法。
    • 分类能够帮助我们完成数据压缩。
      例如,灰度图像需要256个灰度级,对应像素值为[0,255],计算机需要用8个二进制位表示一个像素。若对图像质量要求不高,则可以根据需要将像素点划分为纯黑和纯白两组,分别用0和1表示,这样只用一个二进制位就能表示一个像素点的颜色。采用这种方式,数据的压缩比为8:1。
    • 分类有利于可视化。
      例如,图15-6中的数据原本是混在一起的,分类后我们更容易观察到数据的分布及关系等。
    4、典型应用——异常检测
    • 无监督学习在异常检测方面的应用有信用卡异常监测、缺陷检测、异常数据处理等。
      如图15-7所示,机器学习掌握了正常数据(圆形数据)的特征,在遇到新的五角星数据时,它会准确地将数据A处理为异常,将数据B处理为正常。


      图15-7 异常检测示意图
    5、无监督学习算法

    比较重要的无监督学习有

    • K均值聚类、
    • 可视化和降维、
    • 主成分分析(PCA)、
    • 单分类支持向量机(One-class SVM)、
    • 关联规则学习。

    相关文章

      网友评论

          本文标题:无监督学习

          本文链接:https://www.haomeiwen.com/subject/qbgbwdtx.html