美文网首页
No.1《智能时代​》吴军

No.1《智能时代​》吴军

作者: 小文的菜地 | 来源:发表于2020-01-30 15:57 被阅读0次

    2016年Google 的AlphaGo战胜李世石,这件事是机器智能历史上一个具有纪念意义的年份,它标志着一个时代的结束,也标准新时代——智能时代的开始。AlphaGo的成功,意义不仅在于它标志着机器智能到达一个新的台阶,还在于计算机可以解决更多的智能问题。今天,计算机已经开始完成很多过去必须用人的智力才能够完成的任务。比如:医疗诊断、阅读和处理文件,自动回复、撰写新闻稿、驾驶汽车等。

    计算机获胜,靠的不是逻辑推断,而是大数据和智能算法。在数据方面,Google用几十万围棋高手对弈的数据训练AlphaGo;在计算方面,用上万条服务器来训练它下棋的模型,并且让不同版本的AlphaGo相互对弈了上千万盘,这才保证它能做到算无遗策。这里面有两个关键技术,第一个是把期盼当前的状态变成一个获胜概率的数学模型,第二个是启发式搜索算法,它能将搜索的空间限制在非常有限的范围内,保证计算机能够快速找到好的下法。

    在很多人的印象里,数据就是数字,其实不然,数据的范畴要大得多。互联网上的任何内容,比如文字、图片、视频,医院里的医学影像、病例、公司工厂里的各种设计图纸,出土文物上的文字、图示、尺寸、材料等等,都是数据。在计算机出现之前,一般的文字内容并不被看做是数字。到今天,这种以语言和文字形式存在的内容是全世界各种信息处理中最重要的数据,也是全世界通信领域和信息科技产业的核心数据。研究人员未来更好的研究和处理她们,还专门建立了针对语音和文字的数据库,即语料库。在语料库中,数据主要是语音和文字,数字反而很少。

    在今天,人民谈论数据时,常常把它和信息的概念混淆。严格来说,数据和信息虽有相通之处,但还是不同的。信息是关于世界、人和事的描述,可以是人造的,也可以是天然存在的客观事实。数据本身是人造物,因此它们可以被随意制造,甚至可以伪造。数据最大的作用是承载信息,但并非所有的数据都承载了有意义的数据。只有善用数据,才能获得数据背后的信息。对数据和信息进行处理后,人类就可以获得知识。知识比信息更高一个层次,也更加抽象,它具有系统性的特征。

    比如通过测量星球的位置和对应的时间,就得到数据;通过这些数据得到星球运动的轨迹,就是信息;通过信息总结出开普勒三定律,就是知识。人类的进步就是使用知识不断改变我们的生活和周围的世界,而数据是知识的基础。如果我们把资本和机械动能作为大航海时代以来全球近代化的推动力的话,那么数据将成为下一次技术革命和社会变革的核心动力。

    在大数据之前,计算机并不擅长解决需要人类智能的问题,但是今天这些问题换个思路就可以解决了,其核心就是变智能问题为数据问题。随着各个领域数据不断扩展,开始出现交叉,各个维度的数据从点和线渐渐连成了网,数据之间的关联性极大的增强,在这样的背景下,出现了大数据。

    大数据一词经常出现在媒体上是2007年以后的事情,但大家对它的理解并不同意,甚至有些误解,比如讲大数据和大规模数据混为一谈。大数据最显著的特征是体量大,英文是 big date,而不是 large date。big强调抽象意义的大,large指体量大。仔细推敲英文中 big date 的这种说法,我们不得不承认这个提法非常准确,它最重要的是传递了一种信息——大数据是思维方式的转变。

    自17世纪以来,一直指导我们日常做事行为的最重要的思维方式是机械思维。

    机械思维的形成可以追溯到古希腊。欧洲之所以能够在科学上领先于世界其他地方,在很大程度上是依靠从古希腊建立的思辨思想和逻辑推理能力,依靠它们从时间中总结出最基本的公理,然后通过因果逻辑构建起整个科学的大厦。其中最有代表性的是欧几里得几何学和托勒密的地心说。欧几里得最大的成就不是发现了那些定理,而是在前辈累积的几何学和数学知识的基础上,创立了基于公理化体系的几何学。托勒密不仅构建了大系统,更是一个善于总结方法论的人。他的方法论可以概括为“通过观察获得数学模型的雏形,然后利用数据来细化模型”。托勒密的思维方式和方法论影响了西方世界一千多年。

    他们的方法虽然很朴素,但是很管用。直到今天,我们在做事情的时候还是会首先想到这种方法,几乎所有的经济学家的理论,都是按照这个方法提出来的。如果把他们的方法论做一个简单的概括,核心思想主要有两点:首先假设一个简单的模型,再用这个模型构建复杂模型;其次,整个模型要和历史数据相吻合。

    思维方式和方法远不如方法论对可续的发展重要,东方的文明长期以来在技术上领先于西方,但你在科学体系的建立上远远落后于西方,关键就输在方法论上。

    在古希腊罗马以后,人类对自然界的认识进步非常缓慢,西方进入了中世纪的黑暗时代。东方的中国和阿拉伯帝国虽然在工程和技术上不断进步,但既没有形成科学体系,也没有在方法论方面做出太多的贡献。最终,这个任务留给了笛卡尔和牛顿。笛卡尔的贡献在于提出了大胆假设,小心求证。不过对近代社会思想贡献最大的还是牛顿。西方人对牛顿评价之高是强调官本位的中国人难以想象的。牛顿最直接的贡献在于他用简单而优美的数学公式破解了自然之谜。他的贡献在于指出了任何正确的理论从形式上讲都是简单的,而且又有非常好的通用性,这与东方哲学的大道至简思想不谋而合。从欧几里得到托勒密再到牛顿,在思想方法上可以说是一脉相承而又不断发展的。牛顿不仅把欧几里得通过逻辑推理建立的起一个科学体系的方法论从数学扩展到自然科学领域,而且把托勒密用机械运动模型描述天体的规律,扩展到对世界任何规律的描述。后来人们将牛顿的方法论概括为机械思维。

    机械思维的重要特征,所有问题都有一个通用的解决方法。做为一种准则指导人们的行为,可以概括成确定性或者可预测性和因果关系。它的核心思想可以概括为三句话:第一,世界变化的规律是确定的;第二,规律可以用简单的公式或者语言描述清楚;第三,这些规律应该是通用的。机械思维善于把握确定性难以解决不确定性问题。

    机械的广泛使用和机械思维方式直接导致了人类迄今为止最伟大的事件——工业革命。工业革命之后的100取得的成就远远超过之前两千年的成就。从牛顿时代开始,在之后的3个世纪里,机械思维从此渗透到社会生活的方方面面,人们相信能够用机械解决一切问题,包括许多过去无法解决的问题。

    到了信息时代,机械思维的局限性越来越明显。

    人们发现世界本身存在着很大的不确定性,因此,他们开始考虑在承认不确定性的情况下如何取得科学上的突破,或者把事情做好,这样导致一种新的方法论诞生:在信息时代,谁掌握了信息,谁就能获取财富。如同在工业时代,谁掌握了资本谁就能获取财富一样。

    用不确定性的眼光看待世界,再用信息消除不确定性,不仅能够赚钱,还能把很多智能型的问题转化为信息处理的问题。很多时候,落后和先进的差距,不是购买一些机器或者引进一些技术就能够弥补的,落后可怕的地方是思维方式的落后。机械思维是曾经改变了人类工作方式的革命性的方法论,在工业革命和全球工业化的过程中起到了决定性的作用,今天在很多地方依然能指导我们的行动。如果能找到确定性和因果关系,这依然是最好的结果。但是我们今天面临的复杂情况,已经很难找到确定性。在无法确认因果关系时,数据为我们消除不确定性,数据之间的相关性在某种程度上可以取代原来的因果关系,帮助我们得到我们想知道的答案,这便是大数据的核心。大数据思维不是机械思维的对立,而是一种补充。新的时代,需要新的方法论。

    在未来,我们可以看到,大数据和机器智能的工具就如同水和电这样的资源,由专门的公司提供给全社会使用。

    大数据商业的共同点——尽在数据流中。在很多大数据应用案例中,存在着一些普遍的规律。首先是无目的的收集原始数据。这些数据在生成时常常是彼此独立的,无论是亚马逊顾客的购买行为,Netflix用户收看电影的行为,还是Google用户上网搜索的行为,事先都没有沟通商量,彼此独立。这些大量独立的数据聚合到一起,才能得到客观而准确的统计结论,比如网页搜索和结果之间的相关性,不同商品之间的相关性等。然后使用者根据自己的需求对数据进行筛选、过滤和处理。由于收集这些数据时就没有目的性,从这些数据中能得到什么结果事先也无从知晓,最终从数据中得出什么结论就是什么结论。在上述过程中,数据的流向是从枝末的局部到整体。当我们利用从大数据得到的规律指导商业行为时,大数据的流向则是从整体到局部。经常在亚马逊购物的人会发现,不仅不同的人看到的网页内容不同,而且同一个人在今天和昨天看到的内容也不一样。这种精细到每次交易,甚至每次内容展示的服务,在过去是想都不敢想的,但是靠大数据今天这已经变成了现实,并且代表了未来商业的趋势。

    在历史上,一项技术带动整个社会变革,通常遵循一个模式:原有产业+新技术=新产业。对于大数据应用+大数据,也将缔造无数新产业。

    同时,机器智能带来一个新的问题:既然什么事情都可以让机器做,而且还比人做得好,那人做什么?

    在历次技术革命中,一个人、一个企业,甚至一个国家,可以选择的道路只有两条:要么加入浪潮,成为前2%的人,要么观望徘徊,被淘汰。

    相关文章

      网友评论

          本文标题:No.1《智能时代​》吴军

          本文链接:https://www.haomeiwen.com/subject/ybwithtx.html