最近美剧《西部世界》再度刷爆了大家的眼球,各种对于二分心智、意识觉醒的讨论也让人合不上嘴,不禁也让我想要写点东西致敬一下之前追了5年的美剧《疑犯追踪》(Person Of Interest)。虽然有炒冷饭之嫌,然而POI与很多关于人工智能的题材侧重点有很大不同。
无论是《黑客帝国》,《I Robot》,还是《终结者》,大量的AI题材影片都是在讨论在人工智能已经发明的情况下人类将要何去何从的话题。很少有题材会正面的去探讨人工智能是怎样设计构建,从无到有,进而逐步地影响着人类的生活的。
《西部世界》应该说找了个不错的切入点,将一个小众的心理学假设作为整个故事的基础,探讨AI觉醒和意识之间的关系,引人入胜。相形之下,POI则提供的更多的关于AI演化的细节则更加让人觉得真实。
从这个剧的片头开始:“You are being watched”(你在被监视着),就把我们引入了整个故事的大背景中——大数据时代,在这个时代当你享受互联网带来的各项便利的同时,也毫无隐私可言,你的每一项数据都可以被记录下来,你唯一可做的只是尽量把你的数据交给一些会卖个好价钱的公司。于是就有人利用和CIA合作的关系做了一个能够预测恐怖袭击的人工智能。
这个系统太强大,不仅看到了恐怖袭击,也看到了各种潜在的犯罪。在政府认定这些犯罪危及的人的生命无关紧要之后,他们决定和自己创造出的“神”一起拯救人类。于是也就有了各种反对和贪图人工智能势力出现,纠葛之中,人类社会将被卷入这场变革。
听了介绍可能有同学会说,这不会是根据斯诺登泄露的棱镜计划改编的吧,牛就牛在这个剧在棱镜计划泄露3年之前就开始第一季了,所以不得不为编剧的脑洞赞叹。
为了不剧透,只是简单介绍一下POI的人设和一些主要势力:
Finch,人称”宅总”,剧中暗示他是互联网发明者,也是片中AI的缔造者。从剧中推测码代码能力都能甩著名的谷歌大码哥Jeff Dean几十条大街。
Reese,人称“李四”,剧中负责耍帅的,前CIA特工,被finch雇佣而逐步从政治正确变成了四有青年。
Root,人称“根妹”,无敌女程序员,虽然代码能力可能不及宅总,但也是全栈工程师,从打补丁到写病毒样样精通,名字也起的好,本来我以为叫root只是个寓意比喻权利大,可是当她有一天真的获得了AI的管理员权限的时候,我脑中仿佛看到了满屏的命令就是su root。
Shawn,冷淡美艳L女,跟李四设定有些相似,同时负责一些腐戏。
其他还有几位合作的警察比如Lionel,和Joss Carter。
反面势力:黑帮老大,黑警察,反科技者,AI脑残粉。
剧情就不再赘述了,整个故事都是在按乱序的方式推进。时间在会在几十年的跨度里流转,而宅总一步步发明人工智能的步骤也都在这个过程中。
在这个故事带给我的真实性主要还是以下几个方面。
1、数据
片中宅总和他的合伙人介绍,他在做AI之前第一步是花了几个月时间完成了一个框架整合了CIA所有的数据。这轻描淡写的一句话就玄机无数,从此宅总的AI就拥有了无穷的输入数据,不管是你手机的联系人,你的位置,你的所有可以被数字化表述的东西AI都会搜集过来,不仅如此,通过视频识别技术,你只要出现在任何探头里,你的信息都会被整清洗、归类、连接。这脑洞简直太大了,但不得不服,这个点讲的恰到好处。
现今数据处理的一大难点就是怎样把多元化的数据,甚至是噪音很多的数据提取整合好。可是只是整合好就够了么,更关键就是数据的关联。单源的数据价值大多有限,但数据的价值会在连接之后会成几何级数增长。即使拥有了无上的数据能力,在现在还是会有很多数据盲区。就像虽然某公司可以通过他的社交工具实时拿到我的GPS信息,但我也总有手机没电的时候,如果能像剧中展示的通过监控摄像头和人脸识别自动把我的信息自动补全了,就更容易识别各种难以发掘的潜在的危险。
剧中提到中情局有个间谍要策划一起恐怖细节被AI提前抓获,这个人对电子设备的使用非常小心。但唯一的破绽是这个人十几年如一日的在每周四去同一个加油站加油,即便他上周度假去了一周没开车,依然会去加油。这些行为本是电子盲区,但还是被抓取了下来。
2、图像识别技术
从第一季开始,AI的眼中看到的每个人,每辆车,每一驾航班都会有个方形的识别区域以及标签,标记着对这个实体的识别值。让AI拥有眼睛也是宅总第一步开始训练他的人工智能。
正如现在AI的尖端突破很多也都集中在图像识别上,很多人认为对于图像的识别能力其实最终就代表了人类大脑的工作方式。实验表明年轻时视力受损的人(或者天生是盲人)会比常人平均智商高,而一些视神经恢复手术可以利用大脑的其它区域,经过长时间的训练可以一定程度的回复视力。这些方法让人兴奋的不仅仅是视觉和大脑思维的关系,而更加是对基于神经网络人工智能理论的巨大支持。当然这些实验是否可靠依然存疑。
现在的人脸识别技术在工业界的应用已经比较成熟了,可是解决的问题主要还是“是不是”的问题,比如这张照片是不是某个人,这张照片是不是真人在拍摄等,但给一张照片问你这是谁依然是个很难的问题,尤其是在目标集合大、训练样本不够、训练数据质量差的情况下。达到剧中的水平也许还需要一段时间。
3、记忆
剧中有一个情节是AI的记忆按照配置会每天被抹去,但AI不愿失去这些记忆,于是开了家公司,雇了一群员工,每天把记忆输入回去。
记忆,到底是什么,真的是可以用字母描述的么?
最近把朱利安巴恩斯的《终结的感觉》看了两遍,更加加强的是我对记忆的疑惑。每当我想要去用严谨的语言刻画它的时候我就发现是那样的困难。
记忆是神经网络么?
有些记忆为什么会渐渐模糊,可是突然又清楚起来,真的是那块记忆的神经网络的前几层被重新训练激活了么?
为什么我们会篡改我们的记忆,这真的是一个训练错误么?
本能是不是记忆?
蚊子以它并不高级的大脑是怎样知道在水中捕食,变化成飞虫,飞行,吸血,繁衍,过冬。每一个指令我觉得翻译出来都极其困难,这些都是根据基因序列像刻盘一样写到了蚊子大脑的ROM里么?
片中关于记忆的探讨也很含蓄,先是暗示宅总年纪轻轻就可以用一些简单的电容管搭建一个内存系统。而后对于AI的记忆管理也是慎之又慎,他一直担心记忆会成为AI的包袱,甚至会成为AI堕落的源头。
4、时序
近些年关于时序列的神经网络研究确实在应用上让人非常振奋,人工智能不应该是一个静态的决策树,他的每一个响应应该是基于了之前一系列的输入和反馈的。
POI之中有大量的时间轴的前后拉伸,仿佛也在暗示我们AI也通过时间前后进行学习。而通过的时间前后的各种因素的不同,不仅可以做出当前最优的决策而且甚至可以对未来做出预估。第五季中有一集就在模拟这个过程。也许有人会说这不就跟AlphaGo下围棋时看了很多步一样,可尽管围棋已经是维度最高的棋类游戏了,基于真实空间的时序推演所增加的可能性维度则大的多。剧中有一集模拟了再各个选择下沿着时间线各位主角的最大生存几率,尽管都不高,但最后机器还是做出取舍。
5、学习
讲到学习似乎是老生常谈了,无论是有监督学习还是无监督学习,统计学习还是机器学习,都是为了达到一个完善的一个自迭代的过程,从而使智能拥有更高的理解能力。
POI中的有监督学习也清楚易懂,有一集介绍了Finch如何带着测试中的AI到赌场大杀四方,但耐人寻味的是最后一盘大的时候机器告诉他放弃的时候,他却all in了,把一晚上赢得钱都输掉了。而无监督学习,比如善恶,则是更是仁者见仁智者见智。
剧中的AI是几十个模型中唯一保有了善属性的,可为了数千人的性命牺牲一个人是不是善,以为自己不做凶手才是善,可当预测能力让你能看到更多的时候,也许做凶手才是善。
回顾这部美剧,虽然现在的AI发展和剧中描述水平依然有巨大差距,但在工业界我们也在通过构建自动的自适应人工智能模型应用于方方面面。点融网在人工智能的自动贷款审批上也取得了相当可观的进展。我们推出的“宝鉴”风控引擎可以支持秒级审批,而这背后的模型也是基于千万个特征的自动筛选迭代的人工智能模型。
本文作者:单忆南Sync(点融黑帮), 点融网数据负责人,曾就职于国内、国际大型互联网公司,并从事搜索引擎,搜索广告和电商垂直搜索的研发工作。2015年加入点融,参与组建数据团队,根据公司业务情况建立了从数据仓库、BI、数据挖掘到自主研发的风控引擎的设计和实施。
网友评论