现在的互联网很喜欢说大数据,好像不说大数据就不是互联网企业了一样。
但尴尬的是大数据一直是大家都在说,但是谁也没有真正知道该怎么做好的东西,更遑论有谁在这个大数据的命题上做出任何古烁今造福人类的事迹来?
主要还是现在互联网这个领域太热,大家过于喜欢炒作概念的一个结果。
先看看百度百科收录的大数据的概念:大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
这个定义应该是比较客观的。
所以抛开炒作的各种故作高深的概念,大数据和以前互联网做的东西相比,无非是量级不一样了而已。
举个栗子。
以前做数据,最多是处理成千上万级别的样本,这样大概可以从中挖掘出超市这种“啤酒与尿布”应用场景的典型案例。
而所谓大数据之“大”,无非是现在的技术升级,导致数据的量级连用“亿”这个单位来衡量可能都不足够,于是大家自然会觉得,在这么庞大的数据集群里面能做好数据挖掘的话,就未必仅仅只是找出“啤酒与尿布”这么简单的东西来了,甚至可能找到人类社会最本质的活动规律。然后就出现了储存大数据的机器集群,被叫做“云”,相应的数据处理和挖掘活动也被冠以“云计算”的高大上名号。
So,其实大数据不算新,只是炒作出来的概念新而已,本质还是万变不离其衷。而如果还要追溯的话,生物学早N年前基因测序时就进入大数据时代了——不是我想说人们孤陋寡闻,请问听过“海量数据”这个词吗?那只不过不像互联网行业这么善于炒作和宣传罢了。无怪乎连微车CEO徐磊都说大数据70%是伪命题,虽然他自己也有炒作嫌疑……
说归说,最后还是邓老爷子说的白猫黑猫的问题,炒作也好宣传也好,只要真有互联网企业能把数据用好并使之变成利国利民的生产力,哪怕叫做“超级无敌真心大数据”又有什么关系呢?
我们的眼光在前方,我们的征途是星辰大海。
网友评论