鉴于这几天贵阳正在如火如荼的举行大数据产业博览会,笔者好歹也是经常跟大数据打交道的人,所以今天就想聊聊大数据,找找存在感。
说到大数据,我觉得这个东西对于很多人来说就像天边飘来的乌云,丈二摸不着头脑,神秘莫测。所以为了能让我们对以下的内容达成共识,我觉得有必要先解释一下什么是大数据。
早在1980年,著名未来学家托夫勒在其所著的《第三次浪潮》中就提出了“大数据”这么一个概念,热情地将“大数据”称颂为 “第三次浪潮的华彩乐章”,而《自然》杂志更是在2008年9月推出了名为“大数据”的封面专栏。一直到2009年开始,“大数据”才成为互联网技术行业中的热门词汇。
维克托·迈尔-舍恩伯格和肯尼斯·克耶编写的《大数据时代》中提出:“大数据”的4V特点:Volume(数据量大)、Velocity(输入和处理速度快)、Variety(数据多样性)、Value(价值密度低)。这些特点基本上得到了大家的认可,凡提到“大数据”特点的文章,基本上采用了这4 个特点。
来看看百度百科对大数据的解释,是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。
其实上面这条解释太过于专业化,说白了就是一些不良的信息公司很关心你的隐私数据而无时无刻的记录你的行为而产生的数TB级别的垃圾数据。而某天他们闲得无聊通过分析你的行为记录数据发现你最近经济紧张从而精准的向你全方位的推广各种贷款的广告,并且发现效果还不错。那些垃圾数据这时就成了信息资产。
在生活中有一个现象,就是我们会发现在电商上买东西往往会比在实体商店买便宜,其实这个就是大数据的一个应用的例子。假如我是一个电商,那么我将会准备一半的是真货,在一半半的是仿品,最后一半半直接上假货。那我怎么把这些仿品和假货商品卖出去并且还不吃官司呢?别担心,我通过分析你以前的所有消费记录发现,你就从来没用过真品,那么我就直接把那些仿品处理给你了,你没用过真品,自然不知道那是仿品了。对于假货卖给谁,也不是问题,因为我通过分析发现偶尔发一件假货给你你也没有选择退货或者投诉。也就是说,我开心的赚到了利益,你也很高兴的“低价”买到了东西,如此和谐......。你还别不信,你去打开一个一个商品评价页面就能发现,总有好评、中评、差评。
利用大数据分析,也能给单身狗们带来一些福利。
数学家Chris McKinlay是美国加州大学洛杉矶分校在读PhD,在多次相亲后,对于找到另一半的事情毫无起色,作为一名数学家,他认为自己应该像一名数学家那样使用交友网站。
McKinlay利用自己的天赋,创建了一个自制的机器人程序,可利用假冒的OkCupid账号从网站上搜集女性大量信息。McKinlay花了三周时间从美国2万女性收集到6万问题和答案,之后利用自己研发的改进型K-Modes算法将这些女网友分成7个在系统上存在差异的集群。通过建立数学模型计算的方式优化出两组女性,然后进行约会,在约会第88个女网友时,他找到了自己的真爱。
前不久的阿尔法狗以4:1的战绩战胜了李世石让人工AI火了一把,其实其中也有大数据分析的功劳,恐怕阿尔法早已经通过对李世石之前的棋局分析出了他的套路、习惯、弱点等等。
当然了,大数据在我们生活中的应用还有很多,就不一一列举了。
马云老先生说过,大家还没搞清PC时代的时候,移动互联网来了,还没搞清移动互联网的时候,大数据时代来了。
所以,关于进入未来大数据时代, 你准备好了吗!
网友评论