上一讲我们一起学习了《暗知识》中第一部分:什么是暗知识?暗知识与明知识、默知识之间有哪些区别?接下来我们学习后面 两个部分:第二,讲清楚机器学习的哪些优势使它能够发现暗知识,而这些优势为什么是人类的认知能力所没有的。第三,讲清楚暗知识对产业变革和人自身发展的影响:哪些行业会因为暗知识的发现而产生新的投资机会?
第二个问题是,机器为什么能发现人类不理解的暗知识?我们拿今天机器学习最拿手的模式识别来做个例子,具体看看机器认知是如何实现这一点的。图像的模式识别任务很明确。给一个小孩子看狗的图片,小孩子都知道这是狗。那么我们如何让机器看到狗的图片时也回应说这是狗?这就要学习大脑工作的方式。
人类的大脑是靠神经网络来工作的,神经元之间的联结可以在学习过程中被不断强化,形成一个稳定的联结模式。比如因为狗见得多了,小孩子一看到狗的图片,神经元固定的反应模式就出来了,他马上就知道这是狗。机器学习所依赖的人工神经网络也模仿这一点,用神经元一层一层地组成一个神经网络,不断地用狗的图片去训练机器,调整网络每一层神经元的参数,直到最终反应出正确答案说“这是狗”为止。久而久之,机器也形成了固定的反应模式,给出狗的图片就也能马上识别出来了。
问题是,神经网络涉及的参数太多。像微软做了个能够超越人类识别图像能力的网络就有152层,总共151亿个人工神经元的联结,这么大的量就不可能靠人力去调参数了,而需要设计一种办法让机器自动地调整。想想公安局里给嫌疑人画像都是怎么做的。画师会先问目击者嫌疑人的性别、年龄、身高等,然后问他五官的样子,比如是单眼皮还是双眼皮,是高鼻梁还是塌鼻梁等等。这就是提取主要特征,画师先画出样子,目击者说眼角再耷拉一点,画师再不断改,直到画出目击者记忆中的样子。
机器认知也学的是公安局这一招,就是提取主要特征。如何训练神经网络从人海里一眼认出嫌疑人?先给机器看嫌疑人的各种照片,也就是要先划定几个抓取五官主要特征的模板。比如鼻子,一开始就是随机画的图案,然后在要处理的图像上从左到右从上到下不断扫描,看能否发现重合的部分。如果发现不了就变一变这个图案,然后再扫,直到变得最像嫌疑人的鼻子,就是最重合的时候。这还只是鼻子,再把其他五官特征加上去,甚至机器还可以自己寻找出人类都感觉不到的特征,比如两眼的间距、口与鼻的距离等。把这些主要特征考虑得越充分,最后识别出来的结果就越准确。
机器这种学习公安局画像的方法,有一个专门的名词,叫卷积神经网络。所谓卷积,就是那些抓住主要特征的小模板,把图片上下左右横扫一遍,以求发现重合。这个名称很有些唬人,但它基本的工作方式通俗来说就是这样。机器学习当然还有很多其他的途径,但卷积神经网络目前是在图像识别里最火的方法,因为它非常有效,能够比人脑对图像的识别更快更精确。我们就拿它来当一个例子。为什么机器用这种方法可以发现暗知识?表面上看,机器学习依赖的神经网络就是模仿人脑的,为什么反而比人脑还厉害呢?
一是与机器的感官相比,人类的感官实在太差。人类进化出的感官主要服务于觅食和求偶的任务,眼睛看不见红外线,耳朵听不到超声波,至于触觉、嗅觉、味觉的分辨率更是粗糙。而机器的图像识别依赖的是各种物理、化学和生物类的传感器,这就比人的感官精密得多。不仅可以获取人感受不到的信息,而且对信息的分辨率也远超人类。
第二,人脑的神经元是靠化学分子传导的,每秒钟大约只能传导200次信号,而且还非常不可靠,平均每次传输的成功率只有30%。而那个卷积神经网络是靠晶体管和电信号传导的,不仅比人脑快几百万倍,可靠性几乎是100%。
最后一个原因,大脑内部每一个神经元之间究竟是怎样连接的,连接的强度如何,至今仍是一个黑箱,我们几乎完全不了解。但卷积神经网络中的每一个神经元之间的连接,我们却有着非常精确的控制,各种相关参数都可以存储和提取。这就保证了机器发掘出的暗知识可以在机器之间传播和复制。
尽管机器学习有上述种种神力,但人类也不必妄自菲薄,更不必现在就开始忧心机器会超过人类,因为毕竟它还有很多不如人脑的地方。它最大局限性就是,它只能提取相关性而不会理解因果关系。靠“死记硬背”,像个刻苦但不聪明的学生,不理解公式,靠做海量的习题企图把世界上所有问题类型都过一遍。比如那个识别嫌犯的卷积神经网络,在得到准确的图像识别结果以前,必须经历大量的特定训练,而不会自己举一反三。在训练最开始的时候,神经网络的表现极其笨拙,给它看一张白狗的图片,它甚至可能把白色看作狗的相关特征,于是再看白兔子的照片也依然认为是狗。人类则不同,两三岁小孩子只要看过几只狗以后几乎就能认出所有的狗了,而不需要大量训练。这恰恰是人工智能还不那么像人的“智能”的地方。
神经网络的另一大局限性是无法解释结果为什么是这样。这其实是暗知识的特征,它超出了人类的理解能力,当然就无法解释。在有些情况下,人们只关心有用和有效,有没有解释可能并无所谓。但在许多涉及安全和公共政策的问题上,不可解释就意味着无法充分信任它,也无法和大众沟通。比如医疗领域也可以用卷积神经网络来识别 X 光片,但它的结果绝对不能不加解释就直接用于诊断,而只能作为一种辅助手段,需要专业医生的检查审核。所以医生的地位仍然无可取代。
我们又讲完了第二个观点。概括地说,机器之所以能发现人类都不能理解的暗知识,是因为它模仿了人脑获取知识的神经网络,同时又以更精确的感官、更快更可靠的神经信号传导、更容易储存和复制的优势超越了人脑,使得机器能够抓住某些信息的关系模式。而对于人脑来说,这些模式是既无法描述也不可感受到的。但是我们也要看到,现阶段的机器学习还有两大局限性,这使得它还不能在所有情况下都可以替代人脑。那么着眼于未来的发展,暗知识的不断涌现会改变哪些行业?人工智能会在哪些领域最先取代人类呢?
我们来看第三部分:首先需要想明白的是,这一波人工智能的产业变革浪潮,与上一波互联网发展的浪潮相比,有着非常明显的区别。
互联网从1994年起步,最开始是和传统产业没什么关系的边缘行业,直到今天互联网对传统制造业、农业、交通运输等行业的影响,也还局限在媒体和营销方面。人工智能则不同,它从一开始就在传统产业的中心爆炸,目的就是要颠覆传统行业。在自动驾驶、医疗健康、智能金融、城市管理、智能翻译等诸多新兴领域,机器认知和暗知识已经并将继续展现出它独有的魔力。任何传统产业的从业者都无法置身事外,必须从现在开始就要努力破解应对之道。而对投资者来说,则更是意味着众多潜在机会的涌现。
我们拿自动驾驶来作为一个例子,具体看看暗知识的发现会给这个汽车行业带来哪些潜在的机会。
目前,自动驾驶的自动化分级有一个5级的标准,最高的等级是完全的自动化,车辆可以在所有天气条件和任何场景下实现自动驾驶,无须人类驾驶员介入。这到目前为止只能算是远景目标,还没有成为可商用的现实。一个重要原因就是我们刚才说的机器只会找相关性,但不懂因果,所以对驾驶中出现的形形色色的场景无法理解。目前大部分在开发的自动驾驶车辆,大都在部分自动化或有条件的自动化水平,就是说还是由人负责全程驾驶,但在限定条件下可以由机器驾驶几分钟,或是更明确地分为人负责的时间段与机器负责的时间段。当机器负责驾驶时,人可以手离开方向盘,眼睛不看路,脚离开刹车。能做到这一步已经是相当不错的成就了。
正是由于有了前面说的卷积神经网络等神奇方法发掘暗知识, 进一步提高驾驶的自动化程度才可能成为现实。目前还有一些产业变革上的痛点需要克服。比如说,要实现完全的自动驾驶,就需要有所驾驶区域的高精度地图。为了保证安全性,精度就需要很高,这就可能需要足够的无线传输带宽把不同地区的地图数据传给汽车。更麻烦的是路上的拥堵情况与道路封闭的信息可能是实时更新的,这就只能靠路上行驶的其他车辆收集数据上传云端,再实时下载到附近的车里。因此这就可能造成一个恶性循环:一开始没有几辆上路的自动驾驶车辆,所以也就没有什么实时数据的收集,也就没人敢用自动驾驶上路,反过来也就更无法实时收集路况数据。
克服这样的痛点,一方面是要依赖机器学习水平的进一步提升,但也还要看到,正是在解决之道的求索过程中,新的产业需求就有可能被创造出来。首先,自动驾驶的发展往往又与电动汽车技术密不可分,这就要求能够进一步缩短充电时间,降低电池成本。所以电池技术的突破对自动驾驶来说也会有巨大的商业价值。
其次,充电桩和换电池站将会成为一个巨大的市场。如果有大量的汽车在高峰时间同时高速充电,这就可能对电网造成难以承受的负荷,所以市场也会产生改造旧有电网和储存电能设备的新需求。
最后,传统汽车厂商需要营造成本巨大的线下售后服务体系,你买一辆车就得靠4S 店来解决各种问题。到了自动驾驶实现之后,汽车本质上就成了一台带着四个轱辘的电脑,所需的零部件比现在的油车大大减少,电动车就可以像个人电脑或 iPhone 手机一样变得标准化,这将大大冲击传统汽车行业的营销模式,你就可以像手机App 上购物一样来买车了。
除了对产业的变革以外,机器学习还可能或已经变革着社会和人自身。那些重复性高、可预测和可编程的工作最容易首先被人工智能取代,比如收银员、快递员、公交车和出租车司机等。而很难标准化、程序化,特别是还需要依赖对人类情感理解的工作,就很难被替代,典型的代表是考古学家、心理咨询师、外科手术医生,甚至保姆等。当然,人工智能时代的到来还将产生许多前所未有的新工种。数据标注员就是这样一类新工作。因为要想训练机器识别出暗知识,就得需要大量已标注的数据,包括图像、视频等,原则上需要把被识别种类的所有情况都标注出来,机器才可能完全掌握,这只能依靠大量人工来完成。类似这样的新工作岗位在暗知识被不断发现的时代中将层出不穷。社会还将因此发生更多难以预知的结构性变革,我们所能做的只能是不断强化自身,以应对任何可能的变局。
总结:首先,暗知识之所以区别于明知识和默知识,就在于它既不可感受也无法描述。机器发掘出来的暗知识,尽管无法被人类理解,却可以在机器间传播。
其次,机器以更精确的感官、更快更可靠的神经信号传导、更容易储存和复制的优势超越了人脑,所以它能发现人类都不能理解的暗知识。
最后,机器认知和暗知识的发现将从根本上颠覆传统产业的发展模式,同时在自动驾驶等新兴领域创造出新的商业机会。暗知识的时代同样是机遇与挑战并存。人类自有文字并进入文明社会以来已有数千年的历史。这数千年可以说都是人类获取知识的历史。今天,机器学习给出了人类知识的一个全新方向,竟然可以让人类利用自己都不理解的暗知识去解决问题,而且这些暗知识从总量上说将远远超过人类已经积累和尚未发现的知识。表面上看,这似乎意味着人类是否理解知识已经不再重要,因为反正有机器来替我们搞定一切。但你如果往深里想,这恰恰是对人类掌握知识的能力提出了更为迫切、更为严峻的要求。如果所有人都依赖机器,那么那些因为占有机器的知识而聚集资源的机构或个人,将决定社会权力的分配,公平、正义这些固有的价值体系将有可能要被重新定义。
无论何时,人自身的发展和完善才是解决一切问题的终极目的,在这个意义上,机器并不能改变什么历史,最终具有决定意义的仍然只能是人本身。
网友评论