大数据的发展似乎到了一个节点,因为数据的争夺而引起的硝烟战争越来越多,阿里菜鸟和顺丰的数据之争,京东和苏宁,腾讯和华为都为数据打得不亦乐乎。
区块链重新定义大数据数据作为一种新的生产资料,已经成为大家的共识。于是和土地一样,大家都开始进行圈地,在数据领域进行全力的表现,就是对数据所有权的抢占。
数据同时具备稀缺和不稀缺两种属性
数据的稀缺性表现为,已经生产出来的特定类型的数据是稀缺的,特定的数据集合是稀缺的,特定的数据形态是稀缺的。数据不稀缺是因为数据是可以复制的,这个不同于土地,土地的总量是固定的。一份数据可以无限的复制,这就导致了在经营土地的这种思路,也就是比较典型的经营房地产的这种以占有为手段的经营策略,在数据领域很快就失效了。
对于土地的使用,手段是有限的,你可以占有这个土地,然后你不使用,通过倒买倒卖,来获取收益。但是你占有了数据,如果你不使用或者不会使用,没有足够的使用能力,这个数据很难发挥它的价值。如果说你把他交给另外一个能使用的人,那么你的所有权很可能会受到损害,这种交易往往只是一次性的,因为别人在第二次使用的时候已经有了这个数据。那么这中间的矛盾就出现了,使用者和数据所有者,这个权益是无法有充分的机制得到保障的。我们说这是在新的,以大数据为代表的先进生产力的领域,出现了生产关系的矛盾。那么如何解决这种矛盾?
区块链:开启生产关系变革
既然矛盾的点在于所有权和使用权的冲突,那么我可不可以像土地这样,把所有权和使用权分离开呢?在互联网2.0的技术,这个是没有办法完成的。这种技术下,你只能依靠对人性的信任,而人性是经不起利益考验的。既然我们说区块链是一种生产关系变革的技术,我们看一下在区块链上怎么来实现这个功能?
比如我们知道互联网一半的收入是广告产生的,这其中份额最多的就是在线广告。举个场景为例,你在电脑上登录了QQ,然后打开淘宝开始购物,淘宝可能不知道你需要什么东西,但是如果他知道了你是一个男性用户,是个女性用户,多大年龄?在什么季节?在哪个城市?这些数据,那么很可能他推荐给你的商品,你点击购买的可能性,是比直接漫无目的的投放广告要多很多的。那么这些数据谁有呢?很明显,腾讯有嘛,你登录QQ和微信的频率一定高过你使用淘宝的频率。而且腾讯所拥有的数据的类型,正好和淘宝是互补的,所以这也是,这些公司,一直在互相掐架的原因,阿里一直想切入社交领域,腾讯一直想切入电商领域。但是直到现在,这些数据还没有充分的进行互通。这些数据已经有了,只是在阿里和腾讯的服务器上分别称为一个数据孤岛。
帕累托优化
我们假设一下,在区块链上这些数据怎么链接起来?同时又保证数据所有者的权益不受到损害。继续上面那个场景,淘宝识别到这个用户正在浏览网页,准备购物,那么他向腾讯发起一条请求,根据他收到的这个ip地址或者MAC地址,向腾讯去请求,这个用户的相关的用户画像数据,所在的城市年龄性别等(利用大数据的相关性分析)其他有助于提高广告点击率的这些数据。最简单的性别纬度,分析是个男性用户还是个女性用户。如果是个男性用户,那么我推荐一个剃须刀的广告,如果是一个女性用户,我推荐一个化妆品的广告。这个用户在淘宝完成了购买,淘宝获取了对应的收益。然后他按照数据使用的协议返回给腾讯一部分收益。这个收益是通过机器自动执行的,也就是写的区块链那里的智能合约部分。整个过程中淘宝是获取不了这些数据的,甚至你都不知道谁有这些数据。刚才的这种数据请求是a to b的,如果放在区块链网络上进行广播,那么这个时候就有一个数据竞价,多方同时具备这个数据,那么出价最低的一方,和数据质量最优的一方获得成交的权利。这其实是一个黑盒测试,通过这个黑盒你没办法倒推出原始的数据是什么,但是你可以通过“零知识证明”这样的方式来完成对信息的使用。也就是说,腾讯可以在不向淘宝提供数据的前提下,证明自己有这份数据,并且获得这份数据的收益。
通过这种松耦合的链接,就完成了对数据孤岛的链接。再回过头来看一下我们上面提到的生产关系的矛盾:所有权和使用权的矛盾。这个矛盾就解决了,也就重够了我们的生产关系。整个过程中,完成了帕累托优化。也就是在不损害任何一方利益的情况下,使得整个系统中最少有一方收益增加。
数据共享经济:从所有权到使用权
在新的经济性经济生产形态开始出现的时候,我们的思维往往还是旧有的范式的惯性延续。比如我们对待数据的这种思维,往往还是对待土地的这种思维。用抢占土地的这种思维来惯性的去抢占数据。
伴随着分享经济的发展,新的经济形态对人们旧有的观念造成了新的冲击,并重新定义。比如uber,没有一辆车,却是全球最大的出租车公司,airbnb没有一间客房,却是全球最大的酒店。这是一种新的范式挑战传统范式。
在大数据领域也一样,过去大数据我们说一个是数据体量大,一个是数据的维度丰富。但是前提是你占有了这些数据,你才能使用这些数据。那么现在我们在区块链之上,可以不用占有这些数据,也可以完成对这些数据的使用。那么这个时候大数据就需要进行重新定义了。这个定义就是我不必要有这么多数据,关键是看我能使用多少数据。这个使用是一个数据作为生产资料的共享经济。把每一个数据块看作一间客房的话,那么这些数据块,链接在一起,就是数据共享经济的airbnb。
在这种新的技术基础之上,我们需要对大数据的生产关系进行重新定义:大数据之大不是我们拥有的数据大,而是可以使用的数据大。
智能经济&睡后收入
由于数据不涉及到和硬件的锚定,比如数据本身是一种资产,我不需要一个摩拜单车这样的硬件。这种数据资产的交易过程就可以减少人工参与,不需要工业经济中的物流。我可以把所有的交易的细则写在智能合约里面,交易的报价也可以是动态灵活的。
那么这个时候数据的收益也是自我驱动的。也就是说你有了数据之后,有了知识之后,只用对这个知识做一个智能合约的封装,放在区块链之上,你便可以获得“睡后收入”只要有人访问这个数据,你就可以获得收入。传统大的互联网公司依靠流量24小时获取收入的这种方式,以后对于个人也是唾手可得。因为不需要人工参与,整个的交易标的可以非常小,交易的成本可以非常低,那么由交易成本决定的交易边界就非常低,交易成本的降低,也会改带来组织形态的改变。但是伴随着交易量的增加,整个市场的交易规模会非常巨大。人类对知识的创造,将会成为智能经济的基础生产资料。
区块链和大数据
网友评论