机器学习是迷人的,不仅仅因为它是人工智能的一个重要分支,也不仅仅是它取得了诸如Alpha Go等前所未有的成绩,更不仅仅是因为它汲取了数学,统计学和计算机学科等多种学科的精髓,它的迷人之处在于,划时代意义的理念应运而生:先前计算机“被动”接受信息和规则,从而生成结论的过程,被 “主动” 探求解决方案的全新模式取而代之。“学习”这一人类所独有的行为,参与到一大堆的电子元器件中,变革思维方式的同时赋予了机器生命。
毋庸置疑,优秀的科学成就,丰富的社会知识以典籍方式代代传承,人们的观念在互相影响下薪火相传。“学习”,“探索”并没有在继承中泯灭,反而更加凸显出重要和主导的作用,这些富有行动力的词语,使得人们理解社会,懂得他人和自己的行为变得切实和脚踏实地。
在解读机器学习的起源时,有一条理由格外突出:现实世界的情景过于复杂,人们很难总结出表述清楚的规则。人们在试图获取内在关系未果的尴尬境地,由“告诉”转向让机器“探索”,殊不知,这一举动恰恰是回归了人类认识世界的最原始,最朴素,最可信赖的办法。
2017年5月 阿尔法围棋(AlphaGo)击败排名第一的围棋世界冠军柯洁,完美收官,走下神坛,进入博物馆。自此之后,机器学习的理念不失时机走到前台,走进人们的视野。
阿尔法围棋是机器学习应用的成功典范。在它的后台,程序员一改往日教习围棋规则的做法,采用让机器研习,浏览过往大量比赛棋局,“自我”总结,掌握取胜的办法。以往的大量棋谱是支撑阿尔法围棋学习的坚实的数据基础。
机器学习的核心使命是:基于历史数据获得“隐藏“在其中的关系,然后利用习得的规则,预测未来数据的结果。
机器学习中的“理解”“理解”(understanding),“探索”(exploration)是整个机器学习过程中,出现频度最高的词,是再怎么强调都不为过的动作。 “数据理解”(data understanding)是一个非常重要的步骤,它的使命是理解目前所有基础数据的现状,比如数据的分布,格式等等,以此来决定使用什么样的算法,采用什么样的变化,以期达到最好的模型性能。实践而来的经验告诉工程师,成功的机器学习项目至少要花费70%-80%的时间和精力理解和处理数据。大量成熟的算法和工具,使得数据理解和处理如虎添翼,即便是细枝末节,例如空白数据,同样把理解扩展到了极致:数据缺失类型,缺失对模型产生的影响,选取合适的办法去填充数据。防患于未然,从一开始就杜绝”garbage in, garbage out“( 中文直白翻译为:垃圾进,垃圾出)。
在机器学习的核心步骤“建立模型”,“理解“更是被发挥得淋漓尽致。算法的设计尽显人们在日常生活中的思维路径:有的模型使用”贪婪“算法,有的算法比较相似性,有的算法设法加大异质的距离……设计使得模型有了更多的信赖基础。
如果说传统的计算机应用是一个板起面孔,强行塞给你已有观点的严肃的“家庭教师”,秉承“我所的是对的”的风格,机器学习更像是一个娓娓道来的咨询师,给你解释每一步的原因和结果:这是我们的数据,有什么样的缺陷,我们将会做什么样的补救,我们这么做是基于什么样的原因;使用这个模型是基于这样的考虑,它会有什么样的优缺点,我们是如何取长补短的;学习得到的关系是这样的,准确度是多少,哪些因素起了多大的作用,这样的结果是否满足要求,这个模型还可以做怎样的调整等等……每一步尽在有理有节的解释中,选择与拒绝,客户真的可以心悦诚服。
在最后,用一个小小的例子结束机器学习如何专注于“理解”。故事讲述的是德国和美国的自动驾驶团队在设计紧急避让时的分歧:德国团队倾向汽车失控时撞向少年,避开颤巍巍的老太太,他们的理由是保护女士优先,而美国工程师直接把汽车指向老太太,他们在强调利益最大化,年轻人的未来优先于生命将尽的老人。
闪烁着主观能动的活力和人文情节的智慧在机器学习中随处可见,未来会因更多的“理解”而美好!
机器学习中的“理解”
网友评论