写在前面:本文是系列的第一篇文章,“简单易懂的机器学习知识”系列文章一方面是为了让更多人了解、入门机器学习;另一方面,也是为了让自己在机器学习领域持续学习下去。在本系列中,不会讲细节的算法和论证过程(我暂时也不会😂···),会讲一些简单易懂的基础知识,并附以案例助于理解。
1.人工智能是什么?
在狭义上,人工智能(AI)是指以Siri、Alexa等语音助手,用语音代替界面交互的个人虚拟助手。
在广义上,人工智能(AI)是指由人工制造出的智能机器,是一种能够学习的计算机程序,可代替人类去解决需要人类智慧才能解决的问题。
人工智能包括自然语言处理、语音识别、图像识别、机器学习等,每一个分支都很复杂和庞大。本文主讲机器学习,其他的大家可自行研究。
2.什么是建模?
在我们深入了解之前,先说一下建模的概念。建模是指把具体问题抽象成为某一类问题并用数学模型表示,是应用于工程、科学等各方面的通用方法,是一种对现实世界的抽象总结。(PS:实际建模应用于社会各个方面,产品经理在从实际业务中梳理出角色、流程和实体也是建模过程。如果眼中只有数学建模就过于狭隘了。)
建模的流程具体如下:分析问题中的各种因素,并用变量表示→分析变量之间的关系,相互依存或独立等→根据实际问题选用合适的数学框架(典型的有优化问题,配置问题等),并将具体问题在此框架下表达出某种公式→选用合适的算法求解表达出的公式→使用计算结果解释实际问题,并分析结果。
由此可见,在我们描述的场景下,建模和训练的目标是得到某中算法能够解决某类问题。而在算法应用于实际问题的过程中,通过实践和归纳仍可对模型进行优化,这又称为模型训练。
再次强调,实际建模应用于社会各个方面,只是一种通用方法而已,实现建模的手段也多种多样。我在此描述的只是建模的一种场景。
3.什么是机器学习?
在现实中,到处充满着规则,而设定规则则是人类解决问题的方法。设定规则已经经过人类历史的验证,但是也拥有很大的弊端:面对的问题/场景越多,规则的条数就越多,1000个场景可能需要1000条规则来应对。需求越多,规则越多,法律法规就是一个很好的例子。除非在寻找某条规则能够整合其中几条,以减少“构建世界”的组件,而这又有几人能够做到?举个物理上的例子,17世界早期,人们已经能够区分摩擦力、阻力、重力等,是牛顿归纳为万有引力,而如今的科学家又希望用“大一统理论”阐释强相互作用力、弱相互作用力、电磁力、万有引力四种基本力,这是人类持续进步发展的目的。
如今,设定规则这种办法在面对个性化推荐、反欺诈、网络安全等大数据(数据量大、维度多、增长快、复杂且多样化)场景下,已经捉襟见肘,准确率低而且低效,特别是在长尾部分。
如果所有情况都是已知的,每种情况和应用决策一一对应,那么基于规则的系统就会很高效的运行。过去,由于数据相对结构化和规模小,制定规则相对容易。而如今,数据变得非结构化和复杂多样化,全面的规则制定只能是想想。而机器学习可以很好的解决这个问题。
也就是说,需要解决问题的时候,从前开发者是基于规则进行开发的,规则一般来源于专家(能解决类似问题的人)依赖于经验和实践归纳总结的。而有了机器学习,程序能够通过自己学习去习得算法,而不是专家提供。
定义:机器学习是指计算机有能力基于案例、经验去习得算法,而不是依赖于预先设定的规则和代码。
总之,专家规则是指由专家根据自身经验、知识做出的规则设定,例如阿拉伯数字“1”是一条线,程序就可以根据这条规则去判断是不是“1”。机器学习则是需要输入很多阿拉伯数字“1”的图片,程序通过自我训练学会识别阿拉伯数字“1”。
转载请注明出处~
网友评论