《数文明》是涂子沛老师数据三部曲中的第三部,可能你之前也阅读过前两部作品,《大数据》和《数据之巅》,以前大学期间阅读了《大数据》一书,让我坚定的相信了大数据是人类的未来,《数据之巅》进一步说明了数据其实贯穿着我们人类的历史。昨晚听了得到直播《数文明》的新书首发式,更觉得大数据,是人类的新文明。

今天这篇日更,主要分为两部分,首先先转述直播的主要内容,再说一下听完直播,我的直观感受。下面先直接进入主题。
数据为什么这么重要?
今天这个首发式主要分享四个内容,第一个内容,数据为什么这么重要?
我们首先要知道今天的数据是什么,怎么产生的。今天的数据有两个来源,第一个来源是测量,比如今天的气温,我们得到直播平台上的用户有多少,这都是测量;第二个来源是记录,比如今天一张照片,一段文字,一段音频,一段视频,全部都是记录。它们都保存在计算机里,保存在数据库里,对计算机来说,它们是一样的,所以它们是数据。
科学的基础就是测量,做科研就是做测量、做数据,数据是科学的载体,所以数据非常重要。可能你会觉得科研跟我没关系,我喜欢听音乐,看小说,看电影,刷微信。其实这些全部都是数据,背后都是记录,只要是记录就都是数据,所以数据的核心是记录。得到事实上也是一个大数据公司,因为我们的音频课程就是数据,事实上你购买一个音频课程,你就是购买了几十个数据。未来得到还必须用更多的标签去标签这些数据库,然后引入人工智能,所以我相信得到也是一个数据公司。
数据的记录跟我们每个人都有关系,而且关系非常大。比如说文字,今天文字也是数据。仓颉造字,仓颉看到了鸟兽在地上走留下痕迹,他意识到我们应该对人的行为做记录,于是发明了文字。今天的文明是建立在数据的基础上,所以这本书叫《数文明》。回到数据记录,每个人都在记录,自己记录他人,也成为被别人记录的对象。正如那首中国的现代诗所说的:你站在桥上看风景,看风景的人在楼上看你。明月装饰了你的窗子,你装饰了别人的梦。
为了记录,也延伸出各种各样的事情来,比如说特朗普最近提名的大法官,我们都知道因为性骚扰的问题迟迟没有通过。因为是30年以前投诉没有记录。而特朗普自己本身也陷入过这样的风波,十几年前有一起,他就被迫承认了,因为当时有记录,整个对话被录了下来。他30年前也有一个案子,别人指证他,他不承认,因为30年前记录还没有被普及。这种记录对生活是有穿透性的。再以我自身为例,我在美国工作时经常要回国,有一次我回来录节目,到飞机上我突然意识到我应该给节目组带个礼物,但是已经晚了,所以我只好在飞机上的免税商品买了两瓶香水,然后用信用卡付的账。几天以后问题来了,我太太突然打电话给我,说你回国怎么买了两瓶香水呢?我顿时感到有口难辩。
数据它永远是在揭露一部分事实,数据就像比基尼,它告诉你一部分事实,因为我们只能获得一部分事实,所以我们希望我们拥有大数据。这种零零碎碎的记录在我们手里非常普及,还有比这更普及、更强大的,那就是互联网。互联网是一个记录体系,是整个社会的记录机器。如果我们今天看互联网,还仅仅只是把互联网看作联网,那是不对的。互联网是沉淀数据的基础设施,这跟鼠标有非常直接的关系。鼠标可以把互联网上最细微的动作记录下来,鼠标在60年代被发明的时候,它事实上是个定位的工具,它可以把屏幕上的位置完全定下来,把动作记录下来。比方说,我们今天去百货商场购物,一走进去,你就会这里看看,那里看看,叫东张西望。但是这些东张西望的动作没有人会看见,社会治安也不会关注。但是在互联网上你如果东张西望的话,互联网就能记录下来。比如说你在互联网上搜索,你在互联网上点击,搜索,翻屏,查阅,每一个动作都会被记录下来。鼠标它可以记录人的行为最细微的动作,这就导致了一切行为数据化,一切业务数据化。也就是说在互联网上,数据不是一切,但一切都在变成数据。

所以,第一代包括第二代互联网公司,我们都能看到数据的元素,是数据在给他们创造价值,这是他们跟百货商场,阿里巴巴跟百货商场一个本质的不同。互联网公司可以记录下所有用户在网上最细微的动作,但是,在百货商场这是没有办法记录到的。当然,我们今天看到在线下各种百货商场也在做类似的尝试。我们看到更多的摄像头布在百货商场,它会监控消费者,消费者走到一个货架前面拿起一件商品,他可能放下去了,而捕捉到这个镜头之后,它会分析为什么这个消费者放下去,为什么他走到这个货架前面。这种基于监控摄像头的分析跟基于互联网的分析还是有本质的不同,因为互联网上的数据更加格式化。
正是因为数据,我们今天的互联网公司才能得到蓬勃的发展,为什么这么说,有以下几点原因,
第一,广告
因为有了数据之后,广告发生了革命性的变化,广告更加精准了。广告业有一句非常有名的话,传统的广告人会说,我知道我浪费了50%的钱,但我不知道那50%到底在哪里。但是今天互联网上的广告是精准的,因为它掌握了我们每一个消费者的行为,可以根据他的行为去推送广告。你买了什么东西,是什么档位的,什么价位的,它可能表现为你的收入、你的社会阶层等等,互联网的广告是用数据来读人读心。 所以今天的互联网广告业更加精准。
第二,金融和信用
因为你所有的消费行为事实上表明了你的经济收入,你的社会阶层。所以可以根据这些数据去判断你的金融状况跟你发放贷款。阿里巴巴最早的金融产品是阿里小贷,是向小微企业发放贷款的,根据的就是这个道理,小微企业在我平台上开店,我有它全部的流水,我知道它一天卖了多少东西,这些东西价值多少,应收款是多少,所以我敢跟它发放贷款。
用一句话总结就是数据是整个新商业文明的核心要素。我们看到整个新文明事实上是从商业开始的,我们逐渐能看到从商业,然后延伸到物流、供应链、制造业、设计,甚至农业,整个的社会治理。
如果回头去看的话,我们的社会正在经历几个阶段,几千年的历史,我们看到是农业社会,然后是工业社会,然后是信息社会,今天的智能社会。上个世纪1980年代的时候,德鲁克就预言人类社会正在进入信息社会。他这个话对,但也不全对, 因为他当时没有办法看到信息的本质是数据,数据是所有信息的载体,而大量数据出现之后,我们可以利用这些数据去训练机器,训练算法,让它获得智能,从而代替我们人类去做更多的事情。所以,我们即将进入的是一个智能社会。然后数据是智能的母体基础,是新时代的土壤,我们把这个社会形态定为智能社会,更接近于新时代的本质。
数据到底是什么?
我前面有两本书,我就想分享一下我自己对数据认识的过程。在《大数据》中我认为数据是黄金,数据是石油。但我慢慢的觉得不对,这也是为什么我要写第二本书的原因。在《数据之巅》中提出了数据是土壤。因为黄金跟石油都是有限的,但数据是越用越多,黄金跟石油你有了,他就不能有,有独占性。但数据不是,你有我也可以有,我们无数人可以在得到上收听同一个视频。还有一点不一样,黄金跟石油,一克黄金跟一公斤黄金,它的价值那就是1×1000,数据不一样,一条数据可能没有任何价值,但是一亿条数据,它的价值会呈现指数级增长。所以《数据之巅》中我提到了数据是智能时代的土壤。土壤就更贴切一些,土壤虽然是有限的,但是在地球上我们觉得它在应用层面是无限的。一捧土壤跟一大片土壤,它的价值也是呈现指数级的。

今天有很多人说数据是资源,是资产,包括马云还有很多演讲人说数据是资产,阿里巴巴拥有大数据这个资产。那数据到底是资源还是资产?资源跟资产虽然只有一字之差,但它本质上有很大的不同。空气是个资源,每个人都可以拥有,但如果说它是资产的话,就涉及到产权,就涉及到定价。数据到底有没有产权?应该怎么定价?
数据应不应该私有?
数据的价值到底在哪里?当我们谈到数据有价值,尤其是有商业价值的时候,一个新的问题就出现了,它是资源还是资产,是公有制还是私有制?这是一个石破天惊的问题,对这个问题的不同回答将决定我们未来的经济怎么发展,它是一个分水岭。 也就是说数据究竟属于谁?打个比方,数据对我们个人来说是什么?我数据比作一次照相,但是这个照相不是对我们的脸,也不是对我们的身体,而是对我们的行为,我们的行为摄影,行为照相。一条数据就是一张照片,而且跟传统的照片相比,它有本质的区别。比如你去买东西,你在淘宝、京东上留下了一条数据。但如果你在购买东西的时候,被别人拍了一张照片,可能看不清楚篮子里到底买了什么,也看不清楚价钱,是什么品牌的牛奶,都看不清楚。但是在互联网平台上却看得清清楚楚,所有的明晰全部被记录下来了。也正是因为这些记录,这些数据才具有价值。
从我的第一本书出版以来,我就一直倡导,我们的互联网公司应该有一个接口,所有的用户通过这个接口可以把自己的购买记录下载下来。目前有这种接口的公司,特别是把原数据共享出来,共享给消费者的公司还非常非常少。我们不妨大胆地做一个想象,我们买东西买完之后能不能在阿里巴巴、京东平台上不留下数据?我们应不应该拥有这种权利?假如说我不留下我的数据,那接下来会发生什么?如果大家都选择不留下数据,那阿里巴巴、京东还能成为数据公司吗?他们又会怎么做?我刚刚讲的就是数据的被遗忘权,在互联网上我可以找到平台删除自己的数据。我们刚刚说的数据是照相,不管你同意不同意,只要你买东西,你就被照相。但问题在于照相了之后,底片相片你全部拿不到,它们全部属于互联网平台,而不属于你。

数据的价值源于个人,源于消费者,而不是源于互联网平台。所以,这就是问题,今天互联网公司已经占有了大数据,大数据领域的玩家就在关注这个问题。这个问题的现况常常会让我想到一个例子,那就是14世纪、15世纪当欧洲人来到美洲,他们来到美洲之后,突然发现美洲有很多很多的金矿,所以他们把金子一船一船运走。当时的美洲人印第安人就蒙了,他们不明白他们为什么要把金子运走了,他们不知道金子在另外一个世界、在欧洲、在亚洲那是货币,那是度量衡。他们完全没有认识到,对他们来说,金子也不能吃,也不能做武器,所以金子是没用的。我们今天的互联网公司就是在大众认识到数据的价值之前,已经累积了大量的数据。今天的消费者对这些数据没有占有产权,没有所有权,甚至使用权也没有。这就是问题。
今年5月份,在欧洲公布了GDPR,这是一个法律的简称,这项法律对数据的遗忘权、所有权等诸多方面都作了很多细致的规定,被称为史上最严苛的数据保护法案,就是在保护遗忘权。当我们肯定了遗忘权的时候,在某种程度上我们接下来就要肯定数据的产权,数据是有归属的,它的归属至少不仅仅归属与互联网平台收集数据的人。
数据归属权的问题怎么延伸到社会治理领域中
在数据时代,你不要做坏事,如果你做了坏事你也别逃了,你就坐在家里等着就好了,警察一定会找上来。因为我们今天数据极其充沛,今天的公安工作就是大数据分析工作,案件侦破的过程就是大数据分析的过程。我在国庆节期间看了两部电影,第一部是贾樟柯的《江湖儿女》。这部电影讲的是一个黑社会里面儿女情仇的故事,最后几个镜头之一,就是摄像头装到了麻将馆里,摄像头装到了电梯间。贾樟柯想用这个摄像头的镜头来隐喻黑社会会慢慢消失。第二部是姚晨的《找到你》,讲的是保姆把孩子带走的故事,剧情的反转就是因为天网摄像头。这个妈妈很快意识到她可以调看电梯间的摄像头,她正是在电梯间摄像头发现了事情的真相。
我们可以看到数据、天网、摄像头这些正在进入我们的文艺作品,我们这个时代因为数据,社会治理发生非常深刻的变化。比如说物流和快递。我们今天都能看到一件物品到底在哪里,我们可以查询,它已经到广州了,已经到北京了,到哪一步,在哪个分拣站,刚下飞机还是在飞机上,整个流程可以看得清清楚楚。今天我们每一个人的轨迹,我们都可以看得清清楚楚,我叫它高清视频。我们今天只要出门,在路上走三分钟,你会碰到摄像头。一个伦敦人做了统计实验,一天上街会被摄像头捕捉到70次,你想70个摄像头捕捉到你,只要还原,它就是个轨迹。一部车今天更加简单,对车牌的识别比对人脸的识别率要高很多很多,几乎接近百分之百。一部车你只要告诉我车牌,我立刻可以在天网中还原它在城市当中运行的轨迹。一个人也一样,今天,我们的人脸识别技术相对成熟,在中国你可以看到很多前沿的应用,比如说红绿灯。在深圳、在河北,在很多地方,你闯红绿灯,你的照片就会显示在大屏上,你的身份证号码、你的姓名同步会显示出来。
最近我在九寨沟做项目,为九寨沟做智慧旅游规划。我们在公安局做调研,就会发现警员身上配了人脸识别的识别仪,我们做了一个检测,让团队成员上来。有一个是四川人,一拍照立刻识别,准确率完全正确。第二个是广州人,是个男性,他一拍照一识别,没识别出来,因为他不在它的数据库里,只能识别本省的。但是我们的团队成员很惊讶的发现,识别出来的第一个候选人、第二个候选人跟他长得都非常非常像。这就是我们我说的高清晰社会延伸出来的单粒度治理,人像一个颗粒生活在我们这个社会。原来我们一个国家有十几亿人,要管到每个人那是非常非常难的,但是今天,我们的政府如果把这种力量用足、用够,就可以管到每一个人,掌握每一个人的轨迹。所以我叫它单粒度。比如说以前在大海上,一滴水怎么知道浪潮的方向,怎么知道洪流的方向,我们以前看不清楚一滴水的轨迹,我们只能看到波涛的轨迹。但是今天,我们可以看到每一个水滴的轨迹。我在书里还引用了另外一个比喻,就是满天雪花,以前我们没有办法掌握到每一个雪花下落的轨迹,但是今天这个正在变成现实。
这个书的封面大家看到是几个圈圈,这里面有个来由,就是设计师读了我的书之后,他对书中的一个概念印象非常深刻,这个概念就是数纹。我们知道有指纹,而数纹是我们今天社会开始出现了一种纹理。纹理就是无数的数据,我凭借无数的数据可以识别一个人的身份跟轨迹,而不用知道他的姓名。未来每一个物体,每一个人背后都有无数数据做支撑,我这把这个叫做数体。每一个数体背后有无数的数据在支撑它,背书它,凭借这些数据就可以区别鉴别数体的身份。
所以我们的社会治理在发生非常深刻的变化,针对这种变化,我追溯这个历史,我认为我们人类历史上一直在发展,管理一直在发展,有人治、有法治、有德治。我针对人治、法治、德治提出来一个新的观点,数治,用数据治理一个国家、治理一个社会。数据治理将会成为国家治理一个非常重要的方面。我们已经看到数据治理在发生很大的作用,就像刚刚说的你犯事别跑了,因为你跑不掉,你在家里等着就行了。在书里面,我列举了很多数据的支持,最近几年,我们国家的各种案件都在大幅下降。
为什么会大幅下降?
我在书里面追溯了天网的历史,天网最早出现在1980年代的美国。在1990年代,英国的天网跟美国的天网号称有人脸识别的功能。他们把这种带有人脸识别的功能装到一个犯罪率很高的地方之后,当地的犯罪率大幅下降。但事实上他们的天网没有因为人脸识别抓到一个罪犯。这主要是技术带来的震慑力,它像引力波一样不可见,但是它却有一个数力,有一个力量。当你在被收集数据的时候,你的表现就完全不一样。追溯到中国的唐祖宋祖,最早皇帝身边有两个人,左边的人记皇帝说的话,右边的人记皇帝做的事。这种记录对君权是一种制约,用历史用记录制约这个君主,让他知道少干坏事。君主在受到制约之后,他也想了一个办法,他用记录去制约老百姓,即宗教,在中国的传统文化中有阎罗王,阎罗王手上有一个生死簿,生死簿就是记录你所有的功过是非,做的每一件事,这就是记录的力量。
我相信我们即将会进入一个前所未有的安全时代。在马斯洛关于人的需求当中,安全是最底层的,我们的社会安全会发生一个革命性的变化,我们将会迎来一个五角星社会。今天你留下大量的数据,凡走过的必留下痕迹,凡做过的必留下数据,所以这就是一种约束的权利。我们回到人类历史上去看,其实我们对这种约束是不陌生的,回到1880年代,电灯在美国纽约被发明之后,电灯就大面积普及。在这个过程中,社会学家、犯罪学家发现,电普及到一个地方,那个地方的犯罪率就大幅下降。这种光制约了人类的犯罪行为,制约了人类的侥幸心理。在电灯被发明之前,绝大部分犯罪都是在黑夜发生的。
今天数据就是一种新的光,每个人的轨迹清清楚楚。这种光驱散了人性当中的侥幸心理,所以我们即将会迎来一个前所未有的安全时代。我在很多公安部门交流过这种想法,他们认为大数据太厉害了,我们是有案必破,没案破,破陈案、破旧案。新的案子来了,很快就破了。整个社会的治理,包括环保、包括交通,衣食住行全部的方面,我们生活的方方面面,没有一个方面不会因为数据而得到革命性的巨大的改观。
数据与个人关系
我们有哪些维度可以去观测一个人。第一,体能,我们会奔跑,我们有力气,我们可以学习,我们可以操纵机器;第二,智商,我们有逻辑分析的能力,可以依靠逻辑分析作出判断。第三,情商,情商是根据心理、情绪、情感作判断,情商跟智商是完全不一样的,我们跟人打交道,跟机器打交道完全不一样,我们照顾一个人的情绪,我们要委婉。人有喜怒哀乐,人有面子。

我现在提出一个新的维度,数商。在这个新的时代,我们要有数商。数商是为智商去提供思考的素材,为情商去提供判断的信息。简单的说,数商就是记录组织保存搜索信息的能力,它是情商和智商的基础。如果一个人数商很高,意味着可以很好的搜索信息、保存信息、记录信息、组织信息。我会想起美国的一场大赛,就是机器人和沃森的危险边缘,一个人跟一个机器人在裁判面前像超级大脑一样回答各种各样五花八门的问题,最后机器战胜了人。未来我们可能每个人都会带着一个芯片,这个芯片就是我们体外的大脑。我们人脑有很大很大的局限性,人一眨眼,我想把它隐喻成微分机制,我们看到的东西并不是全部,只是其中一部分。但是硬盘能把它看到的东西完完全全地保存下来,所以我们很快就会想到,有一天我们的芯片就在身上,我们有一个体外大脑,我们有一个增强大脑,这个大脑可以帮助我们很快地回答任何问题,它能帮助我们只要见过一个人,见过一张脸一次,我们就能认识这张脸,就能叫出他的名字,这就是优势。
我在书里面分享了一个我年轻时代的故事,我最早的时候是个理工男,然后去到部队,最早的时候是写程序。写程序是我的工作,但是在部队在写程序之外,每一个人也必须写材料,我写不好材料,最后我发现了一个办法,剪报纸,剪报纸事实上是个大数据的工作。我把所有的报纸,我能看到的主要聚集在四类报纸上,把我认为好的素材分门别类剪下来,然后装到一个剪报夹里,不断地调整剪报夹的内容,把同一种内容归纳到一起。在归纳的基础上经常诵读,边诵读边归纳,很快,半年我写材料的能力大幅度提升,最后还做过部队首长的秘书。这就是善于记录。
回顾自己的生活,记录有一种向外的记录,还有对内的记录,对内的记录就是写日记。我在很多人生阶段会写日记,我今天回头一看,我突然很惊讶的发现,凡是我在写日记的阶段就是我人生进步精进的阶段,我一不写日记,停下来,进步就停止了。历史上这样的例子非常非常多,我的书里面回顾了林彪怎么做笔记跟记录,记录的过程就是把它变成数据的过程。我们今天的电子化是把它变成电子数据的过程。我的书里面回顾了林彪怎么通过一些有限的情报判断敌人的指挥部在哪里。再说的就是曾国藩,曾国藩也是个非常善于记录的人。他给自己要求是终身记录,他把记录分成三种。第一种是工作,第二种是读书,他每天都要记一则他工作当中的笔记,还要记一则他读书的笔记,第三种就是闲谈,笑话。闲谈当中跟朋友讲的笑话他也记下来,我现在经常有很多时间去交际,我就发现准备一两个笑话事实上是非常非常有用的人际关系的润滑剂。
我们大脑是有限的,所以我们要记录,我们要体外的大脑。我个人用的工具就是微软的one note,这是可以交叉记录的一个工具。我在书里面考察了很多类似的成功人物,我发现一点,凡是善于记录的人,没有不获得职业成功的。这是我的一个发现。数据就是记录,我们今天在这个大数据时代要获得个人的职业成功,我们就要善于记录,提高自己的数商,快速地找到信息。书里面我还提到做简报,另外一个就是做卡片,卡片就是我们手头的记录。
今天的内容分享了数据的价值来源于记录。数据有巨大的商业价值,我们今天看到的变革,它从商业领域开始,延伸到社会治理,生产制造,种植等等领域,我们即将看到一个更大的变革,今天我们只能看到这个变革的序曲。我们要有数商,我们在面对未来时,我们要意识到文字也是数据,曾经人类所建立的文明之所以叫文明,是因为它建立在文字的基础上,但是数据不仅仅是文字,数据的光谱要比文字更加广阔。如果说文字是金字,那么数据就是金书,我们即将看到一个更广阔,更宏伟的人类新文明。
昨晚听完直播,对我来说有以下几点感悟:
1.数据时代,我们每个人都变得越来越透明,我们一生中所有的事情几乎都会被记录,不要做坏事,因为没有什么事情是可以被隐藏的。经历做好当下每一个微小的事情,最终都会像小溪汇聚成海洋。正如那句古话,勿以善小而不为,勿以恶小而为之。
2.我们的任何行为都会产生数据,我们在享受便捷的同时其实也是在向互联网交付我们的行为数据,个性推荐的兴起背后就是在获取我们的数据后,系统推荐他们认为我们喜欢的,虽然一开始会不准确,但只要这个飞轮转动起来,最终的结果就是它们会比我们更了解我们自己。
3.数文明是文明的往前走了一大步,基于文字的文明和基于数据的数明最大的区别就在是流通,任何行为都可被记录,在数据面前,我们最好的姿态就是拥抱数据,主动量化自己,才能在新文明中保有优势。
网友评论