这几年有关大数据的话题非常的火,不但是研讨会、培训、微信圈的热门主题,出版行业发行和大数据有关的书也成了销量的保证。由于关注者众,“大数据”变成了流行用语,白领们开口闭口不提几句大数据好像跟不上时代潮流,会显得自己落伍了,而任何事情只要套上了大数据,或是沾到边,瞬间就高大上起来。但是等等,你确定你真的在玩大数据吗?
数据大不等于大数据
大数据最大的迷思在“大”。许多人以为自己公司拥有的会员或是客户数量多,就是在玩大数据,然后老板就夸下海口说未来要成为一家大数据驱动的公司。但是数据大真的不等于大数据,因为这些海量的数据内容通常不过是姓名、地址、电话、电邮、交易记录、性别等传统的、可结构化的资料,从这些数据里面你能用来分析的技术或用法,就是传统的数据分析,一样都是从人口变数(例如性别、年龄、居住地、学历等等)起始去下条件,然后去分析数据。比如,用年龄层去做分析,找出消费公司产品的各个年龄带的分布,进而看哪个年龄带的业绩贡献度较高;或是用地域别,找出消费公司产品的地理分布,看看哪些城市或是省份卖的较好……你说我分析的样本数高达数百万人耶,但是拜托,这真的不叫大数据。
大量数据本身并不会为企业带来价值
大数据的另一个迷思在“贪多”,想尽种种方式去收集消费者的各种结构性、半结构性或其他你能想到的各种信息,但是你在收集数据之前有没有一套数据政策,收集海量数据的目的是什么?收集之后要用做什么?如果不厘清楚,那么就会像蚂蚁把食物携回蚁穴储藏一样,一直堆栈在那里;但公司可是花费了庞大的软硬件投入及后续持续支出的管理成本,储存了海量但是绝大部分将来用不到的各类数据,这是企业资源的严重浪费,而当真想要提炼有用数据的时候,过于庞大的数据反而会形成“噪音”干扰。
拥有大量数据本身并不会为企业增加价值。收集来的数据必须将来能使用的上,否则数量再巨大,内容再多元,它对企业的价值也不会比资源回收场的垃圾更佳。所以,再强调一次,企业必须要有看待数据的清晰政策,而不是人云亦云的也来搞个大数据追时髦。有了清晰的政策,才会知道在收集目标消费者点点滴滴信息时的漫长过程中,什么是必要的,什么是可以暂存的,什么是可以删除的。观念对了,才能驾驭大数据为你创造价值,而不是面对庞大的数据茫茫然不知从何下手。
大数据是一种面对数据的较新观念,不管是在搜集层面、处理层面还是对结果看待的态度,所以只要符合这种观念,即便你的会员或顾客只有几千人或几万人,一样可以玩大数据,关于这一点以后有时间再另文详述。
在规划大数据前,先想一想投入产出比
如果你收集了海量数据,有消费者的个人信息记录、交易记录、手机上网的网页浏览记录、微博上的po文及关注的记录、LBS的所有记录、在公共场合使用免费wifi上网的记录,在亚马逊、京东商城、当当等多家电商的购买记录……OK,这个数据量够大,而且够多元,够复杂,但如果你公司没有足够的能力去分析这些数据,并把分析的结果用起来,那么,我们只能称贵公司拥有大“量”数据,而不是在运营“大数据”。
有没有能力分析是一种限制因素,但也并非斥巨资让公司有大数据的收集、管理及分析能力就OK了,还要看贵公司做这件事情有没有意义。这回到之前谈的,你的数据政策,你的why(为何收集),而不是How(如何收集)。兹假设几个场景及在这些场景下我的个人见解:
场景一:某家公司卖手机配件,主要渠道在门店,他们需要大数据的收集及分析方式吗?哪款手机的配件好卖,看传统的报表就知道了,配件有不同的设计风格,或是颜色,这也可以从日常销售报表看出其在消费者心目中的接受度,更何况设计这种东西通常是在最上游就决定好了,下游店家凭经验及过去的销售报表作为采购的判断就很稳妥了,不致于常常误判造成资金变库存,因此,需要折腾大数据吗?
场景二:某家公司透过电子商务卖学龄前的儿童玩具,好,他们需要LBS的信息吗?需要在公共场所使用wifi的信息吗?如果他们只是一个区域经销商,就算他们用大数据分析出了某些关连性,进而发现某种趋势可能会发生,但是他们的采购量不足以让工厂为他们量身订做可能会大卖的商品,或是商品的零售价太低,即便热销,整体营收跟在大数据上的投入根本不成正比,那么大数据对这家公司的意义是什么?
场景三:某连锁现做饮料品牌在全国有3千家门店,以卖珍珠奶茶,泡沫红茶及现榨果汁为主力,每家门店的空间大约在15平米左右。且让我模拟个夸张一点的情况:如果说他们透过大数据分析得出麻辣锅汤底会是非常抢手好卖的品相,他们能遵从数据分析的结果,在3千家的街边店卖麻辣锅汤底吗?如果从各种多元、庞大的数据分析出来说果汁及冻茶饮会是最好销的,这更是废话了,用了严谨的研究方法及庞大的信息收集与处理成本,却得到一个常识(common sence)。
举这几个假设的例子,也许有些极端或夸张,但我意在说明,不是每家企业都需要大数据,要看用不用的上,就算用的上还要衡量投入产出是否符合经济效益。所以公司必须清楚自己为什么需要大数据?有没有其他替代方式,比如是不是把传统数据分析做好做透,就可以达到数据为企业提供决策参考的目的呢。
关注数据的“相关性”,而非寻找因果证据
笔者企业界的朋友说他们在玩大数据,但在我问了几个问题之后,我就知道他们根本不是在用大数据的观念,所以根本就不是大数据的运用。我为什么这么武断?因为,这些公司分析数据的目的是想找出为什么某样产品卖的好?是谁在购买?他们的购买频率如何?这些抱着目的性的探索是传统数据分析的想法,它可能提供一个因果关系的解答,但是,更多可能是分析者已经带着预设立场,只是想验证是否如此而已。这种处理数据的态度根本不会提升企业的视野,带来“洞见”(Insight)。
大数据的特色之一是找出相关性,在样本等于母体的情况下,去提炼出一个预测性的分析结果,这是很大的一个突破,改变了人类多年来探索世界的方式,因为对分析结果没有预存立场,所以往往会产生很多想像不到的价值,这些价值能帮助企业看到别人看不到的商机,或是不断调整自己的市场战略战术,让对手望尘莫及。在数据分析案例里面很有名的啤酒加尿布故事,以及塔吉特超市预测客人怀孕了的故事,都是很经典的大数据分析思维,从众多不相干的信息里找出关连性,进而挖掘出有用的商机。这两个经典案例我不多做介绍,百度一下就有了,我想说的是如果当初分析人员是带着某种假设来面对超市的原始数据,他们就不会发现或是挖掘出这些倾向或是细节,也就不会改变商品陈列的组合方式或是设计出对企业更有利的采购动线。
后记
大数据时代带来的巨大影响,对厂商、对个人、对国家、对社会还没真正充分的展现出来,但是我们已经可以感受到它在我们生活中的作用以及带来的变化。在这个萌芽阶段百家争鸣是很正常的事情,但是也容易被一些人打着大数据的旗号去忽悠敛财,企业的决策者最好先读几本大数据方面的经典书籍,培养自己对于大数据的正确认知,才不会“为了大数据而大数据”,或是以为在做大数据但其实还是传统数据分析的事情。
因为篇幅的关系,有很多想法无法阐述清楚,我的领域是Direct Marketing;从事过邮购、电话销售、电商、电视购物等工作,这些公司都是高度靠数据驱动生意的行业,所以多年来从工作中积累了一些数据运用的经验与体会,也因为职业的关系,一直关注与数据相关的各种信息或是演变,但我万万不敢称自己是大数据专家,所以在文章中有说的不清楚,甚至观念不对的地方,欢迎各界先进予以指教,感谢。
本文作者蒋博文,文章首发于咨询家,观点仅代表作者个人,不代表咨询家立场;如需转载请注明作者姓名以及 “来源:咨询家(微信号:zixunj)”
前往咨询家微信,回复“蒋博文”,可查看作者信息。
网友评论