大数据,听起来无所不能,做起来却并不容易。
近期,我和大数据专班的同事搜集了互联网上流传的大数据“十大经典案例”,通过这些知名案例的解剖和思考,以期获得一些有益的启发,更加深刻地认识大数据、更加科学地建设大数据。
一、“十大经典案例”
![](https://img.haomeiwen.com/i11638027/b73231f02d2b59e6.jpg)
大数据”十大经典案例“是互联网上流传的,非官方大数据案例。
1、啤酒与尿布——数据分析,发现潜在规律
全球零售业巨头沃尔玛在对消费者购物行为分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段。没想到这个举措居然使尿布和啤酒的销量都大幅增加了。如今,“啤酒+尿布”的数据分析成果早已成了大数据技术应用的经典案例,被人津津乐道。
2、数据新闻让英国撤军——数据统计,最有说服力
2010年10月23日《卫报》利用维基解密的数据做了一篇“数据新闻”。将伊拉克战争中所有的人员伤亡情况均标注于地图之上。地图上一个红点便代表一次死伤事件,鼠标点击红点后弹出的窗口则有详细的说明:伤亡人数、时间,造成伤亡的具体原因。密布的红点多达39万,显得格外触目惊心。一经刊出立即引起朝野震动,推动英国最终做出撤出驻伊拉克军队的决定。
3、胸部最大的是新疆妹子——数据统计,发现潜在规律
淘宝数据平台显示,购买最多的文胸尺码为B罩杯。B罩杯占比达41.45%,其中又以75B的销量最好。其次是A罩杯,购买占比达25.26%,C罩杯只有8.96%。在文胸颜色中,黑色最为畅销。以省市排名,胸部最大的是新疆妹子。
4、QQ圈子把前女友推荐给未婚妻——数据关联,发现潜在规律
2012年3月腾讯推出QQ圈子,按共同好友的连锁反应摊开用户的人际关系网,把用户的前女友推荐给未婚妻,把同学同事朋友圈子分门别类,利用大数据处理能力给人带来“震撼”。
5、“魔镜”预知石油市场走向——数据分析,预测未来
如果你对“魔镜”还停留在“魔镜魔镜,告诉我谁是世界上最美的女人”,那你就真的out了。“魔镜”不仅仅是童话中王后的宝贝,而且是真实世界中的一款神器。“魔镜”是某公司的一款大数据可视化产品。“魔镜”可以通过数据的整合分析可视化不仅可以得出谁是世界上最美的女人,还能通过价量关系得出市场的走向。在不久前,“魔镜”帮助中石等企业分析数据,将数据可视化,使企业科学的判断、决策,节约成本,合理配置资源,提高了收益。
6、Google成功预测冬季流感——数据分析,预测未来
2009年,Google通过分析5000万条美国人最频繁检索的词汇,将之和美国疾病中心在2003年到2008年间季节性流感传播时期的数据进行比较,并建立一个特定的数学模型。最终google成功预测了2009冬季流感的传播甚至可以具体到特定的地区和州。
7、大数据与乔布斯癌症治疗——数据分析,预测未来
乔布斯是世界上第一个对自身所有DNA和肿瘤DNA进行排序的人。为此,他支付了高达几十万美元的费用。他得到的不是样本,而是包括整个基因的数据文档。医生按照所有基因按需下药,最终这种方式帮助乔布斯延长了好几年的生命。
8、奥巴马大选连任成功——数据分析,预测未来
2012年11月奥巴马大选连任成功的胜利果实也被归功于大数据,因为他的竞选团队进行了大规模与深入的数据挖掘。时代杂志更是断言,依靠直觉与经验进行决策的优势急剧下降,在政治领域,大数据的时代已经到来;各色媒体、论坛、专家铺天盖地的宣传让人们对大数据时代的来临兴奋不已,无数公司和创业者都纷纷跳进了这个狂欢队伍。
9、微软大数据成功预测奥斯卡21项大奖——数据分析,预测未来
2013年,微软纽约研究院的经济学家大卫•罗斯柴尔德(David Rothschild)利用大数据成功预测24个奥斯卡奖项中的19个,成为人们津津乐道的话题。后来,罗斯柴尔德再接再厉,成功预测第86届奥斯卡金像奖颁奖典礼24个奖项中的21个,继续向人们展示现代科技的神奇魔力。
10、超市预知高中生顾客怀孕——数据分析,预测未来
明尼苏达州一家塔吉特门店被客户投诉,一位中年男子指控塔吉特将婴儿产品优惠券寄给他的女儿——一个高中生。但没多久他却来电道歉,因为女儿经他逼问后坦承自己真的怀孕了。塔吉特百货就是靠着分析用户所有的购物数据,然后通过相关关系分析得出事情的真实状况。
二、得到的启示
![](https://img.haomeiwen.com/i11638027/18803ca35514efbc.jpeg)
启示一:大数据的原理
知其然,更要知其所以然。
大数据的原理是什么?大数据的原理是”三个臭皮匠,顶个诸葛亮”,本质是量变引发质变。
量变必然引发质变,这是个哲学命题,无需论证。
大数据,如果我们给它界定一个数据量级,例如有人提出1亿条以上就是大数据,等等说法,那一定是错误的。大数据是一个相对概念,相对于零散的、不成规模的数据,下无界限,上不封顶。
至于数据的积累,达到多少就会质变,这也不确定。我们只能确定,只要不断积累,就一定会质变。
2017年5月,公安部科信局魏局长在余干调研时,举了一个“菜地有金”的例子,很典型:
菜地里有金子,金子在哪?不知道,翻地吧,肯定有。
所以,我们今天开展大数据工作,不要去纠结数据量级,持续不断地汇聚数据、积累数据,这些数据迟早会“开口说话”。
启示二:大数据的作用
大数据能做什么?很多人很迷茫。
我们的目标是服务实战,说得再具体一点,就是实现“预测,预警,预知,预防”的效果。
未卜先知,先知先觉,可能吗?有人提出,这是个伪概念。例如,如果股票走势可以预测的话,那不是乱套了,只需要一套股市大数据分析软件就可以源源不断地赚钱,果真如此,那些巨头公司,还需要那么努力地做业务吗?
这个例子,给热衷于大数据的人浇了一头冷水。
我的理解是,未来,确定性与不确定性并存。预测是相对的,不可预测是绝对的。也就是说,可以预测,而不是无限预测。
前面的十大经典案例,有6个案例是用于预测,3个案例用于发现潜在规律,1个案例用于增强说服力。
再进一步概括,大数据的作用在于,看见你看不见的,知道你不知道的。
有点玄,但的确如此。
启示三:大数据的思路
那么,回到现实,怎么做呢?我想,当务之急是三个方面:
1、把数据汇聚起来。搭建平台,让实时、准确、全量的数据,源源不断地流入大数据平台。用人工智能的语言表述,就是增强社会面的感知能力。这是一项前提性、基础性的工作。
2、增强数据分析能力。面对海量数据,如何挖掘数据背后的潜在规律?这就是数据分析要解决的课题。需要借助分析思维、分析模型、分析方法、分析技术来实现,需要综合运用统计、关联、比对等常用方法。这是一个难点问题,也是核心问题。
3、解决瓶颈性问题。集中解决数据上不来、不实时、不标准等问题,使大数据战略形成体系,全面落地。
网友评论