还记得这一幕吗?
2017年5月28日,棋手柯洁以0:3完败AlphaGo,彻底击碎了人类在这种复杂游戏中的尊严。这位骄傲的天才少年柯洁,下完棋以后在后台擦眼泪,说根本看不到赢的希望。因为他无法理解阿尔法是怎么下的。
让更多人吃惊的是,不光棋手不理解AlphaGo怎么下,就连设计它的谷歌工程师都搞不清楚,它为什么这么走。
这就有趣了。谷歌在AlphaGo之后又造了一个AlphaGo0。AlphaGo是先学人类的残局学棋谱,最后超越了人类。AlphaGo0不学人类的经验,而是从零学起,自己和自己对弈。让人惊异的是,七天之后,AlphaGo0就超过AlphaGo的水平,40天之后就打遍天下无敌手,至今依然没人能打败它。
这件事给我们带来了更大的震撼——人类引以为傲,积累了两千多年的围棋经验,对AlphaGo0来说一钱不值。不仅一钱不值,而且从AlphaGo身上可以看到,学了人类的棋谱后,反而受到了限制,水平无法突破,也就是说,人类所谓已知的技能反而是累赘。
这就让人震撼了,AlphaGo0在从零开始学棋的过程中,究竟发生了什么样的变化?人类依然无法解释,这就是神秘的“暗知识”——它是一种不可琢磨无法形容,隐藏在海量数据中的相关性,或者万事万物间的隐蔽关系。
问题是,机器为什么能发现人类不理解的暗知识?
譬如,拿今天机器学习最拿手的模式识别做个例子。图像的模式识别任务很明确,假如给一个三四岁的小孩看狗的图片,他能一眼识别出来。那么,机器如何识别呢?最简单的方法就是学习人类的方式,形成人类的大脑思维模式。
人类大脑是靠神经网络来工作的,神经元之间的联接,在学习过程中,被不断强化形成一个稳定的联接模式。比如一看到狗的图片,神经元固定的反应模式就出来了,知道是狗。AlphaGo的神经联结模式正是模仿了人类的这一特点,能够快速识别出图上是狗。
关键的一点是,神经网络涉及的参数太多,像微软做了能够超越人类识别图像能力的网络,就有152层,总共151亿个人工神经元的联接。这么大的量,很难通过人力去调参数,需要设计一种办法让机器自动调整。
这个过程很像公安系统刑警部门在获取若干证据的前提下,侧写师根据有限的资料,比如嫌疑人的性别、年龄、身高以及五官的模糊样子,就能提取主要特征,画出一张具有辨识度的图。
机器正是学了这一招,提取主要特征,比如鼻子,一开始是随机画的图案,然后在要处理的图像上从左到右从上到下不断扫描,看能否发现重合的部分。经过大量扫描重合的过程,最终找到最重合时,便成了。
不仅如此,机器还可以自己寻找出人类都感觉不到的特征,比如两眼之间的距离,口与鼻之间的距离等,把这些主要特征考虑的越充分,最后识别出来的结果就越准确。
机器这种画像的方法有一个专门的名词,叫卷积神经网络。所谓卷积,就是那些抓住主要特征的小模板,把图片上下左右扫一遍,以求发现重合。
那么,为什么机器用这种方法可以发现暗知识?表面上看,机器学习依赖的神经网络是模仿人脑的,怎么反而比人脑更厉害呢?这中间,当然是因为出现了一个“变”字。
首先是感官之间的比较,人类的感官比较差,主要服务于觅食和求偶的任务,红外线、超声波等都无法察觉。至于触觉、嗅觉、味觉等分辨率更是粗糙。而机器的图像识别依赖的是各种物理、化学和生物类的传感器,当传感器发生作用的时候,其速度、效率都远高于人脑的神经连接。
其次,人脑的神经元是靠化学分子传导,每秒钟大约只能传导200次信号,且还非常不可靠,平均每次传输的成功率只有30%。而卷积神经网络是靠晶体管和电信号传导的,比人脑快几百万倍,可靠性几乎是100%。
还有一个原因,人的大脑内部每一个神经元之间究竟是怎样联接的?联接的强度如何?至今仍然是个迷。但卷积神经网络中的每一个神经元之间的联接,人类都可以进行精准的控制并提取各种相关参数,这就保证了机器发掘出的暗知识,可以在机器之间传播和复制。
神经网络的另一大局限性是无法解释为什么会这样,“只可意会,不可言传”——这种暗知识的特征,进一步颠覆了人们的认知。(未完)
网友评论