书名:计算机视觉40例从入门到深度学习:OpenCV-Python
作者:李立宗
出版社:电子工业出版社
出版时间:2022-07-01
ISBN:9787121436857
第15章 机器学习导读
15.1 机器学习是什么
一、核心和关键
-
机器学习的核心
就是从数据中发现模式与规律,根据数据完成任务、寻找答案。 -
没有数据机器就无法学习,
数据是机器学习的核心和关键。
二、解决问题的方式
我们在使用传统方式解决某个问题时,特别是希望发现某个规律时,通常会综合考量各种因素。
解决问题的方式通常有两种:
- 试错
一种方式是不断地试错,先尝试方法A,
若方法A不太好,则继续尝试方法B;
若方法B还可以但还不太完善,则不断对其进行优化;
最后得到解决问题的合适方案。 - 经验
另一种方式是根据经验直接解决问题,
即人类根据自己的经验和实践不断地寻找解决问题的方案。
三、建模
人类在发展过程中在不断尝试发现事物之间的联系、内部隐藏的规律。
-
自由落体运动模型
示意图如图15-1所示,
牛顿因苹果产生了万有引力的灵感,人们根据万有引力定律构造了自由落体运动模型,
根据自由落体运动模型,可以计算出任意运动距离对应的运动时间,以及任意运动时间对应的运动距离。
图15-1 自由落体运动模型示意图 - 以数据为基础
上述过程是以数据为基础的,我们通过这些数据发现了本来存在的但是一直没有被发现的规律。 - 机器学习也是通过数据来发现逻辑与规律,构建事物之间的联系的。
四、黑盒
-
机器学习构造了一个数据的输入与输出之间的“公式”。
当向它输入数据时,它能够直接通过“公式”给出输出。
例如,我在某短视频App中看了一个与机器学习有关的视频,该App会继续给我推荐相关的视频 -
机器是一个黑盒,其内部使用的“公式”是我们构想出来的。
通常来说,机器学习中使用的机器是利用一系列参数控制的各种操作。
五、机器学习的特征
1、避免人的参与,直接从数据中发现
机器学习的一个重要特征是,尽量避免人的参与,尝试直接从数据中发现规律和解决问题的方案。
例如,在识别手写数字时,不论传统方式,还是机器学习,都需要先提取出手写数字的特征,然后针对特征进行处理。例如:
- 传统方式:
通常使用欧氏距离等对特征数据进行计算,从而识别数字。 - 机器学习:
使用机器学习的分类器,如KNN(K近邻)、SVM(支持向量机)等算法完成对数字(特征)的分类、识别。
2、根据已知数据总结规律
在机器学习中,机器根据已知数据总结规律。与从头开始寻找解决方案来比,这种方式更加高效。
如图15-2所示,不同解决问题阶段人类参与的程度不尽相同。
图15-2 不同解决问题阶段采用的方法
- 传统方法。
此时,还没有现成的提取特征方法,需要我们绞尽脑汁去寻找提取特征的方法;找到特征后,我们要分析特征,以找到问题的答案。 - 过渡阶段。
我们已经掌握了大量的、科学的、标准化的特征提取方法(SIFT等),这些方法都可以直接拿来使用,非常方便而且高效。但是,在找到特征后,仍需要我们想办法分析特征,以寻找答案。 - 机器学习。
提取特征的方法已经相对成熟,我们可以直接使用现成的算法来提取特征。得到特征后,不再需要绞尽脑汁想特征如何处理,而是直接采用现成的算法(KNN、SVM等)把特征作为抽象的数值对其进行分析,从而得到答案。
网友评论