从二战盟军破解德军密码的故事,谈一谈云
“我们已经见到的远远不是全部!”在2019数博会开幕式上,图灵奖获得者、美国计算机科学家惠特菲尔德·迪菲发表了极为精彩的主旨演讲,用二战盟军破解德军密码的故事向世人剖析了人类历史上从没来没有面临过的云时代伟大变迁,“我们整个社会正在走向云端,云将是未来社会的重心、它的核心、它的光芒,而大数据、AI人工智能、网络安全这三要素,将是未来网络治理中的关键。
整个社会正在走向云端
“今天我们所讨论的一切,是5千年或者7千年以来我们一直都没有做过的。”惠特菲尔德·迪菲说,此前人们是生活在自然世界中的,人们走在大地上,生活在最原始的建筑结构里,靠农耕来为生,但是几千年前,人们搬进了城市,从这个时候开始,人们首次住在人造的环境当中,“现在我们又在这样做,而且力度更大。我们整个社会正在走向云端。”
在过去,城市可以控制一个大帝国,比如罗马人想做的一切不能仅仅在罗马城里完成,而是要依靠其所控制的省邦。“同样我们也可以设想一下云社会、互联网社会,它也是汲取广泛存在的物理社会的资源,但是云是它的重心、它的核心、它的光芒,而大数据、AI人工智能、网络安全是最重要的三大要素。”惠特菲尔德·迪菲说。
计算为大数据而生
到底大数据是什么?惠特菲尔德·迪菲解释,这是人类所能够处理的最大极的数据,所以它会随着技术的变化而变化,但有一点是永恒的,就是大数据从现在开始会永远与我们同在,而且不断的变化。
所以,大数据是人们所能够处理的最大的数据集,目的是帮助人类实现新的目标。
“在某种意义上,计算是为了大数据应运而生的。”惠特菲尔德·迪菲介绍,二战要破解密码就需要处理当时人类无法自行处理的数据集,那个时候就有了百万字符级别的数据量。
“大数据当时的三个属性今天也丝毫没有改变,分别是数量、多样性、速度。当时有几千个窃听人员,而且很多都是女性,她们都被训练得非常熟练,她们在听电话、语音包括窃听电报,归根结底,这是各种通信信号,而且是包括多种语言,德语、英语、法语,而且是用不同的密码,他能够处理各种的语言信息格式,而且每天甚至每小时都在变。”
“所以今天我们所倾注的数据属性在二战的时候,在计算机诞生的时候就已经有了,其数据量是10的15次方,或者是10的18次方这么大。”惠特菲尔德·迪菲认为,相比过往,今天数据的多元、多样性应该说是无限的,传感器可以捕捉到任何信号并运行在网络上,以前一个小时之内数据可能不会有太大的变化,现在1秒钟的几分之一时间数据就会有巨大的变化。
AI的能力迭代:从取代行动到取代思考
惠特菲尔德·迪菲认为,大数据几乎与互联网同步开始产生商业价值。
大数据这个词语从上世纪90年代开始流行,当时有了互联网,万维网可以诞生出大量的数据,大数据可以被所有人或者是为一小批人进行加工、抓取价值、盈利。
“大数据必须由传感器来获取,在二战当中就是几千名窃听人员;大数据还必须有足够的存储空间,当时又有纸质、磁带、手写记录,今天我们所依赖的电子存储设备当时还没有被发明;在二战结束之时,英国破解密码组织开发出了现在被认为是当代计算机的前身,它的速度是每秒5千字。”
尽管当时的电脑处理能力与现在天差地别,但惠特菲尔德·迪菲特别指出,AI技术在当时已经开始萌芽,并得到应用。
当时盟军的密码破解系统之所以能够够破解德国最高级的密码系统,另外一个重要的要素是人工智能。“我更加喜欢英国人的说法,它叫机器智能。所谓机器智能就是任何一种技术用机器来做之前,需要人才可以做得到的事情。”
那么,哪些事情是人类曾经擅长的呢?最早的时候比如国际象棋,从上世纪60年代末就已经有了这样的机器智能,可以把终端摆到象棋比赛当中,在实时比赛当中跟人对弈。几十年后,很快机器就超过了人,现在象棋已经是机器决胜的领域。后来,机器智能又进军到围棋了。
“还记得60年代的时候,我们当时非常振奋,因为50年代乔姆斯基发明了深层语法,60年代我们非常希望结合他这个理论打造一种机器翻译的软件,能够很好地把人类不同的语言做一个最好的转换。后来很遗憾没有能够开发出好的分析系统,今天最好的系统也只是凑合能用,还不是特别好。”惠特菲尔德·迪菲回忆道。
“未来我想AI最重要的方面应该是机器可以就人们所无法思考的事情去思考。”惠特菲尔德·迪菲举例,“比如说有个数据库,里面有几万亿或者是万万亿个维度,这是人类想不通的,人没有办法去想。我们只能想非常局部的一些维度,但是机器可以直接理解这样的大数据集。这个时候机器可能会有些行为,让我们觉得非常意外,因为人类根本就不理解。再比如说有一个高维度数学可以证明一些命题,现在人类数学家是无法去求证的,未来我觉得会有些高维度的数学命题机器是可以求证的。”
“大浪淘金”的数据安全能力
最后,惠特菲尔德·迪菲强调了网络和信息安全。“我将其成为‘可利用性’。”他说,“可利用性通常是各种系统的最高、最严肃的要求。你要旅行或者你办理银行业务的时候,如果突然系统中断不可用,你可能会非常不高兴;尤其是自动驾驶汽车,比如变成不可用了,把你甩到路边沟里去了,你肯定不高兴。这是有危险的。”
“信息的完整性、真实性同样重要。”他说,“真实性说明你知道这个司机的信息来自哪里,不见得来自一个人,可能来自政府,这个信息也可能来自一家公司,这个信息可能来自任何地方。然后,你可以确信这个信息是没有被篡改过,没有发生任何破坏和变样的。同时,信息也不总是需要保密,也就是说要保证只有一部分人能够理解这些信息,你传输的信息或者你收到的信息,沟通的信息只有一部分人可以理解他。”
惠特菲尔德·迪菲进一步解释,“值得说明的是真实性和保密性之间有一定关联的。而违反保密,一个常见的攻击方式是钓鱼方式,看似真实的请求,电子邮件或者打电话要你的一些信息,以这种方式来打破你的保密性,给到应该给到的人。”
“我个人希望人工智能可以带来新的思考方式,可以对计算机运算,对编程方面有新的思维,从而改变安全性。”惠特菲尔德·迪菲说,有一句话人们经常爱讲,比错误还错,就是垃圾进、垃圾出,所谓垃圾进、垃圾出,在大数据的场景下是大错特错,“大数据应该是垃圾进、黄金出。从垃圾当中能够找到黄金。”
什么是大数据的安全呢?惠特菲尔德·迪菲举例,有三个最有价值的搜索流量,一个是百度的,一个是Google的,另一个是亚马逊的,这些流不是公开的,专门流向这三家公司,这三家公司严格保密,一方面是保护自身的利益,也是在保护用户的保密性。通过搜索流量,比如可以让我们知道很多关于疾病发生的情况,哪些疾病在哪些地方更加常见,这三个公司的搜索流量非常有价值。
“还有控制数据采集,未来很多数据采集的过程会变得比较公开。比如人脸识别技术,亚马逊的人脸识别技术现在很值钱,但是他只会把结果给到某些人,但是经过一段时间以后,我想这种人脸识别技术可以用在自己的手机上,然后人们可以用它来识别人群中其他人的脸呢。这一天有可能很快就到来。”
网友评论