最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,他称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。” “大数据”在物理学、生物学等领域以及军事、金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。大数据作为云计算、物联网之后IT行业又一大颠覆性的技术革命。云计算主要为数据资产提供了保管、访问的场所和渠道,而数据才是真正有价值的资产。企业内部的经营交易信息、物联网世界中的商品物流信息,互联网世界中的人与人交互信息、位置信息等,其数量将远远超越现有企业IT架构和基础设施的承载能力,实时性要求也将大大超越现有的计算能力。
当大数据还在众说纷纭时,维克托・迈尔-舍恩伯格就以对大数据进行了深入而系统的研究,并与麦肯思・库克耶编辑在《经济学人》发表了大数据专题论文,他曾说,世界的本质就是数据,大数据将开启一次重大的时代变革。
Google,Microsoft,亚马逊,IBM,苹果,Facebook,twitter,VISA都是大数据时代的领军企业,他们都洞察到了大数据的发展,在其中他们“受益匪浅”。
IBM执行总裁罗睿兰认为,“数据将成为一切行业当中决定胜负的根本因素,最终数据将成为人类至关重要的自然资源。”未经处理的数据就像源矿,毫无价值,只有经过分析与处理的数据才有价值。大数据及分析最大的魅力就在于能够为国家、企业、医疗机构等带来分析洞察力,依托数据更加科学的来进行决策,进一步推动生产力发展。对于大数据分析,IBM采用的是一种“人工智能”+“大数据”的方式来提供大数据分析和服务,即“Watson Foundations”。
曾在《危险边缘》中一举成名的沃森能够战胜人类的“秘技”主要有以下几个:能够识别自然语言;从知识库中搜索证据来支持假设的答案;具有学习能力。IBM认为,随着信息的增加,以学习的、交互的方式,随着数据的进一步增长逐步提高认知的分析行为,就是“认知计算”。在IBM内部,“沃森”所代表的就是“认知计算”,IBM已经将认知计算作为未来大数据分析的战略方向。“沃森”基于IBM Power硬件平台,实际上“沃森”的认知计算能力并不仅限于Power,而是能移植到其他IBM系统上。IBM的Watson Foundations是一个开放式平台,传统的大数据解决方案用户也能获得认知计算带来的好处。
现在,IBM已经创建了三大类认知计算系统:新一代的对话系统;新一代的探索系统;新一代的决策系统,这是认知计算的最高应用境界,能帮助客户提供最佳的决策,如根据客户过往购物情况和实时购物情况,预测接下来客户要买什么。
“沃森”正变得越来越受欢迎,因为它所代表的“认知计算”让大数据及分析变得更加简单。
在国内,百度已经致力于开发自己的大数据处理和存储系统;腾讯也提出目前已经到了数据化运营的黄金时期,如何整合这些数据成为未来的关键任务。每一个商业巨头都在紧紧把握这次机会。
一分钟内,微博推特上新发的数据量超过10万;社交网络“脸谱”的浏览量超过600万……你把它们当作抒情议论的工具,华尔街的敛财高手们却正在挖掘这些互联网的“数据财富”,先人一步用其预判市场走势,而且取得了不俗的收益。他们究竟是怎么利用这些数据的?这些数据具体有六大价值:
(1)华尔街根据民众情绪抛售股票;(2)对冲基金依据购物网站的顾客评论,分析企业产品销售状况;(3)银行根据求职网站的岗位数量,推断就业率;(4)投资机构搜集并分析上市企业声明,从中寻找破产的蛛丝马迹;(5)美国疾病控制和预防中心依据网民搜索,分析全球范围内流感等病疫的传播状况;(6)美国总统奥巴马的竞选团队依据选民的微博,实时分析选民对总统竞选人的喜好。
几乎每一个成功的人,成功的企业都充分利用了大数据的绝妙优势。
苹果公司的传奇总裁史蒂夫・乔布斯在与癌症斗争的过程中采用了不同的方式,成为世界上第一个对自身所有DNA和肿瘤DNA进行排序的人。他得到的不是只有一系列标记的样本,而是包括整个基因密码的数据文档。对于一个普通患者,医生只能期望他的DNA排列同实验中使用的样本足够相似。但是,史蒂夫・乔布斯的医生们能够基于乔布斯的特定基因组成,按所需效果用药。如果癌症病变导致药物失效,医生可以及时更换另一种药,也就是乔布斯所说的,“从一片睡莲叶跳到另一片上。”乔布斯开玩笑说:“我要么是第一个通过这种方式战胜癌症的人,要么就是最后一个因为这种方式死于癌症的人。”虽然他的愿望没有实现,但是他获得的所有数据还是将他的生命延长了好几年,也才有了iphone的一次次创新,带给我们的一次次惊喜。[1]
采用所有数据而不是样本数据,增加了我们解决问题的方法和能力,降低了我们的直接和间接经济损失,甚至挽救或者延长了人的生命,这就是大数据的魅力所在。
沃尔玛是世界上最大的零售商,在网络带来的巨大数据之前,沃尔玛在美国企业中拥有的数据资源是最多的。在20世纪90年代,通过把每一个产品记录为数据,沃尔玛可以让供应商监控销售速率、数量以及存货的情况,利用此沃尔玛成为了世界上最大的“寄售店”。而且在2004年,沃尔玛对历史交易记录这个庞大的数据库进行了观察,这个数据库记录的不仅仅包括每一个顾客的购物清单以及消费额,还包括购物篮中的物品,具体时间,甚至购买当日的天气。他们注意到,每当季节性飓风来临之前,不仅手电筒的销售量增加了,而且POPTarts蛋挞的销量也增加了。因此当季节性飓风来临时,沃尔玛会把库存的蛋挞放在靠近飓风用品的位置,从而增加销售量。[2]
当数据点以数量级方式增长时,我们会观察到许多似是而非的相关关系,大数据的相关关系分析法更准确、更快,也更不易受到偏见的影响。[3]
任何事物都有两面性,大数据难道带给我们的只有好处而无弊端吗?不,当然不是。大数据的最大弊端就是隐私。
Google、Yahoo!、微软搜索、Ask.com以及万维网进行边路的其他许多搜索引擎,通过碎网页的诸葛搜索,使得所有人仅在搜索框中键入一两个关键字就能访问这些网页。然而在不经意间,搜索引擎记住了许多,比网上发布的信息多得多。Google能识别出我们每个人在什么时候搜索了什么的,以及我们可能觉得足够准确并点击进去的搜索结果是什么。毫不夸张的说,Google对我们的了解比我们自己能够记住的还要多。[4]
他们得到了我们如此之多的隐私(并非我们自愿给予的),我们完全处于赤裸的状态(虽然Google等都对他们存储的信息进行定期的删除)。我们的隐私不再隐私。
大数据为我们带来便利的同时,也为我们埋下了巨大隐患。但是我们不会因为它的不足就摒弃它,相反地我们要好好利用它,并对它产生的弊端进行研究,拿出合理的解决方案。
如有侵权,请联系删除
网友评论