大数据和区块链都是当下热门技术,那么两者之间又有何差异呢,能否结合起来发挥更大的效应呢?
生命周期之不同
作为技术来说,我们常用咨询公司高德纳提出的技术成熟度曲线来分析和预测某个技术的成熟演变速度和所需的时间,而从下图中我们可以看到大数据技术和区块链技术在高德纳历年技术成熟度曲线中的出现情况。
从图中我们可以看到大数据技术首次上榜是在2011年,而当时所处的阶段算是技术萌芽期,并且当时还不是叫大数据技术,而是统称为“大数据和极端信息处理和管理”;
2012年热度持续上升,并且在2013年达到过热期,接着从2014年开始就逐渐下滑,而到了2015年大数据技术已不再出现在图中,当然这并不是意味着大数据技术消亡了,而是大数据以及从当初的新兴技术发展为主流技术了,受到了更多企业的关注,在生产活动中所占据的重要性也提升了。
而相比之下,区块链技术在2016年才第一次出现在高德纳的历年技术成熟度曲线中,而当时出现时就已经跳过了技术萌芽期而直接进入过热期,当然这与资本的追逐不无关系。因此对比来看,大数据技术和区块链技术的生命周期其实是大为不同的,两者之间有接近5年的差距。
大数据顾名思义是描述数据集足够大,足够复杂,用传统的方式根本无法处理。但与之相比区块链技术所能承载的数据量却是极为有限的,远远达不到大数据的标准。
并且从结构上来说区块链严格意义上来说数据结构定义严谨的块,通过指针来组成链状结构,属于典型的结构化数据,而大数据所要处理的数据往往是非结构化的数据居多。
区块链系统的主要作用是突出在安全方面,因此在其区块上的信息也是相对独立的,但相比之下大数据着重的是对信息进行一个整体的分析。并且区块链这种不可篡改的分布式账本的特性使得其天然就是一个数据库,而大数据是通过对数据进行分析归纳之后建立的数据库,两者之间一个直接一个间接。
并且我们常说区块链技术遵从“代码即法律”,这是一种用算法来说话的方式,而大数据则是希望通过数据来说话,两者之间存在较大的差异。
那么既然大数据技术和区块链技术存在这么多的差异,两者之间的这些差异能否调和,相互结合发挥更大的效应呢?
对于一个分布式系统来说,通常遵循CAP定理,也被称为布鲁尔定理,它指出任何一个分布式系统都不可能同时满足以下三点:
一致性:分布式系统中的所有数据都备份在同一时刻是否有同样的值。
可用性:集群中一部分节点发生故障后,集群整体是否还能响应客户端的读写请求。
分区容忍性:当集群中的某些节点无法联系时,集群整体是否还能继续服务。
由于当前的网络硬件仍然会出现延迟丢包等问题,所以分区容忍性是必须要实现的。那换句话说就是CAP定理表明必须在一致性(C)和可用性(A)之间进行权衡。
而具体到区块链技术和大数据技术来说,大数据技术是以牺牲一致性(C)来换取可用性(A)和分区容忍性(P),而区块链则是优先保证了其一致性(C)。
通过CAP定理,我们知道大数据技术和区块链技术之间存在诸多的特性是无法两全的,因此需要针对不同的场景,在多样化的取舍方案下设计出多样化的系统。
网友评论