机器学习是什么?
今天说说机器学习,本系列会分几个部分进行探讨。本篇文章,将会用非常直白的语言进行介绍机器学习的基本定义,帮助普通人也可以理解机器学习。
首先,要明确什么是机器学习?打开灯,是机器学习吗?打开电视机,遥控电视,是机器学习吗?基本的交通信号灯控制程序是机器学习吗?一个复杂的计算天文数字的程序是机器学习吗?这些都不是。
机器学习的一大特点就是“改进”。英文词汇是“adapt”。直白的说就是,它可以对你的输入进行自己改进,而这种改进是没有人为干预的。但有一点要明确的是,他的这种改进一定是非常严格的按照机器学习模型进行改进的,而不是肆意妄为。所以现在不用担心他们的学习能力。
机器学习主要有以下定义[1]:
1.机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。
2.机器学习是对能通过经验自动改进的计算机算法的研究。
3.机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。
什么是机器学习模型呢?
机器学习模型是机器学习算法的结果。假定有一个方程F,那么当你输入值的时候,会返回给你结果。
什么是机器学习算法呢?
机器学习算法是揭示数据内潜在关系的过程。
需要注意的是,机器学习模型不是从定义好的功能中提取的,而是从历史数据里面得到的。所以当你使用不同值输入的时候,那么这个机器学习算法的结果也会变化,自然而然这个模型也会发生变化[2]。
举个例子,机器学习是如何进行学习识别猫的。那么我需要提前准备大量的猫的照片,然后得到一系列的数据关系,也可以理解为数据的方程。照片是由像素构成的,每个像素再由RGB三种颜色组成。那么再把这一系列的像素值的关系,和我们目标的值(要给机器看的照片)进行比对,就可以得出我们输入的照片里面有无猫了。
机器学习的任务是从巨大的映射空间里面学习函数(方程)。
映射空间可以这样理解,假定一张照片是一个像素,那么就是256。那么输入和输出的映射空间就是256*2 。所以,当照片像素很高的时候,那么空间是很大的。数据也很大,数据的关系也很复杂。
机器学习,按照对模型对操作过程中又分监督学习,半监督学习,无监督学习。按照输出对结果来分,又分“Classification" 和 “Regression”。也可以按照其他的分,有很多种。将在以后的文章中详细介绍概念。
我们为什么需要机器学习?
机器学习的应用非常广泛。从军事领域再到民生领域,方方面面都用得到。预测交通状况,帮助司机预估堵车时间。判定天气状况,预测灾难。监测动物,识别动物。提升手机应用效率,合理利用电池。利用机器学习基因监测, 大幅提高检测能力。提升短视频推荐算法,提升短视频推荐能力。
我记得facebook专门介绍过他们的机器学习应用。facebook在用在了很多方面[3]:
1.机器学习确定投送广告,向谁投送,何时投送。
2.一系列的排序,也是按照机器学习来的。
3.你看到的推荐好友,也是机器学习。
机器学习的算法可以用在不同的环境,就比如识别过猫的算法,也可以进行用来对人脸的识别,可以用相同的分类方法来训练一个模型。简而言之,机器学习的数据和模型是分开的,两者可以替换以产生不同的效果。然后严格的按照模型,自适应的调整行为。
[1] https://en.wikipedia.org/wiki/Machine_learning
[2]https://machinelearningmastery.com/a-tour-of-machine-learning-algorithms/
[3] Hazelwood, Kim, et al. "Applied machine learning at facebook: A datacenter infrastructure perspective." 2018 IEEE International Symposium on High Performance Computer Architecture (HPCA). IEEE, 2018.
Andrew Ni
最后,如果有想了解其他的或者有问题的,可以关注我的公众号联系我。
网友评论