我们真正想要的,是那些时光中流淌的数据!
----李逍遥
很多人会和我一样,认为大数据技术本身会让这个世界变得越来越无趣;
但是却无法抵挡掌握了一种可以无限接近所有事物运作本质的技能带来的诱惑;就如一个好奇的孩子拿到一把杂物间钥匙,即使明知道门后也许隐藏的都是些无聊的书籍,他仍然会义无反顾的将其打开;
同时大数据却的确能够带来些额外的乐趣,比如著名的“三体”问题,1900年由David Hilbert提出后,人们一直试图建立一个精确的数学模型去描述三个质量、初始位置和初始速度都是任意的可视为质点的天体,在相互之间万有引力的作用下的运动规律,但到目前为止一直无法找到有效的计算方式;数学界更加明确的说法是这个数学模型并不存在;
刘慈欣的硬核科幻销售《三体》的基本理论基础就是这个三体的不可预测性;我们在这里开一个脑洞,如果使用大数据模型,对于三体星人来说,虽然仍然无法准确的预知下一次乱纪元的到来时间,但随着数据的积累,他们完全可以建立一个无限接近于符合三体运行规律的时间模型,他们要做的就是一次次的生存、一次次的毁灭、一次次的积累数据并传承下去;这是应该算一个大数据应用的极端例子
另一个有意思的例子仍然来自于科幻小说,即使有些人没有读过阿西莫夫的科幻小说,但一定知道他在《我,机器人》中提出的机器人(人工智能,AI)的三大定律:
LawⅠ:A ROBOT MAY NOT INJURE A HUMAN BEING OR, THROUGH INACTION, ALLOW A HUMAN BEING TO COME TO HARM.
第一定律:机器人不得伤害人类个体,或者目睹人类个体将遭受危险而袖手不管
LawⅡ:A ROBOT MUST OBEY ORDERS GIVEN IT BY HUMAN BEINGS EXCEPT WHERE SUCH ORDERS WOULD CONFLICT WITH THE FIRST LAW.
第二定律:机器人必须服从人给予它的命令,当该命令与第一定律冲突时例外
LawⅢ:A ROBOT MUST PROTECT ITS OWN EXISTENCE AS LONG AS SUCH PROTECTION DOES NOT CONFLICT WITH THE FIRST OR SECOND LAW.
第三定律:机器人在不违反第一、第二定律的情况下要尽可能保护自己的生存
这三大定律到目前为止仍然指导着人工智能领域构建的伦理边界;
其实除了这三大定律之外,阿西莫夫在其史诗科幻小说《基地》中提出的“心理史学”理论更是准确的描述了“大数据”的终极应用场景:通过对海量数据的运算预测整个社会(甚至宇宙社会)的历史、文化、科技、经济甚至政治格局走向;书中的前半部并没有解释这种让人吃惊的预测能力从何而来,很多人甚至认为这是一部魔幻小说,但到了后半部分,阿西莫夫给了这个“魔法”提供了有力的科学支撑,从现在的理论看来,就是在「气体运动论」(物理学)、「群众心理学」(心理学)、「历史决定论」与「群体动力论」(历史学)的综合体上叠加大数据技术,产生了强大的预测和控制能力;强烈建议在大数据领域耕耘的兄弟们去读一读这部伟大的作品!
我们目前的认知水平,对于数据本身的价值认知并不是十分明确;这一方面受限于我们的认知水平,但给我们带来最大障碍的就是所谓的“数据鸿沟”; “数据鸿沟”的产生根本原因并非人为,而是传统的社会分工,传统的社会分工模式使数据的所有权被肢解,给数据的流转融合变成了几乎不可能的任务;
就如在鸟山明先生的漫画《七龙珠》中,只有收集齐七颗龙珠才能召唤神龙,这是一个对目前大数据整体市场的一个形象比喻,唯一不同的是在这个世界里,孙悟空和他的朋友们面临的是成千上万颗龙珠的收集;
要实现数据的超融合,有两种方式可以选择,一种是较为理想的情况,就是通过改变社会分工模式来实现部分数据的流转和共享,这种模式在很多小场景已经在进行受控范围的尝试,比如在交通领域,我们可以看到很多管理部门在试图通过建立一个标准的数据资源池,将港口、公路、民航、地铁和铁路的数据收集在一起;再比如政府将各个行政管理部门的数据打通,为市民建立一站式的服务窗口;目前一个非常好的例子是通过将各个省户籍数据的打通,使旅居外地的市民可以异地办理护照签证,这一个数据的打通带来的初步价值是:每年节省回乡办证产生的在途费用30亿人民币;这些都是非常成功的数据共享和融合带来的价值;
但是这种数据流动和共享的范围还远远不够,数据在行业内流动就如“近亲繁殖”,造成的直接结果就是“变异”程度不够,产生的价值只能简单的叠加,无法如化学反应般产生指数增长的大价值;
第二种方式似乎有些异想天开,就是建立一个全球性的“数据交易”市场,使数据在不同行业间产生大迁徙;每个数据所有者都可以在这个平台上进行数据的交换,如果有必要也可以分享数据融合带来的衍生价值;
对于很多人来说,这种方式存在明显的问题,其一便是数据共享带来的安全问题;另外还有数据本身的价值评估;
数据的安全和数据的价值,从表面看起来这是两个问题,但如果深入到数据的本质,其实这是一个问题,而且这个问题的答案就是这个问题的解决办法;
和我们的传统的认知不同,在未来,价值越高的数据其安全级别会越低;
道理很简单,真正有价值的数据是揭示事物运行本质的工业数据,而非我们现在大量收集和使用的商业数据;
商业数据的个性表现和货币表现使其所有者对这些数据有先天的保护欲,在大多数情况下是拒绝交易和分享的,这一点就像我们的个人隐私一样,应该得到尊重,但是对于这个世界运作的本源来讲,这些个体的表现和局部的利益并没有多大的价值;
而作为驱动这个世界运转的工业数据,它的特点就是强烈的共性和共生价值;每个拥有者只拥有这个数据的一部分,也就是七颗龙珠的一颗,如果仅仅持有这一颗龙族,除了作为装饰品外一文不值,但如果七颗龙珠共享,神龙就会被召唤出来,对于这七颗龙珠的所有者来说,龙珠的价值得到了真正的体现;
其实现在在科学界早就建立了很多全球性的数据共享平台,不同背景、不同国籍的科学家在这些平台上共享其成果和数据;这些平台也许在不久的将来会衍生出专注于数据交换的商业模式;
众所周知,数据是未来社会最主要的生产材料;
既然是生产材料,具有其商业属性;
既然是生产材料,就要流通交易;
其实说了那么多,我并不是想讨论大数据技术本身(我也真不懂),我真正想说的是,在不久的未来,数据交易共享市场会是一个海量市场,会是下一个eBUY,下一个Alibaba!让我们拭目以待!
帝都吹牛笔记之干掉那个客户经理!
网友评论