![](https://img.haomeiwen.com/i6010331/ba99b153e8c8db9f.jpg)
三星(满分五星)
这是一本偏向以营销为导向的数据科学书籍,本书从对数据的看法入手,探讨了“相关性”在数据研究中的利弊,论述了以精准广告投放为主的预测模式存在的局限性,相应的提出了语义分析和网络科学的作用,最后落脚到了消费者在数据时代的体验环境,特别要提一点,作者提出了一个“恐怖谷”等多个理论在数据生活时代带来的影响,既反应了AI技术发展以来人们的种种担忧,也提出了一个个性化时代的理论峰值。
今年以来,我读了不少网络科学的书籍,对它们在预测分析中的应用很感兴趣,这本书提供了一个有趣的视角,也更为落地,换个角度,其实本书应该称为数据科学应用指南更为恰当。
大数据已经打开了预见人类模式的窗口,但是它并不是预测个人最有效的方法,同时它也并未消除统计分析的谬误,带着这些错误的幽灵,把社会科学运用到分析中才有未来的图景。
以下是我的解读。
一、数据的变与不变
很多人对数据的认识还停留在“数”这个阶段,然而随着语义分析、图像分析以及语音分析的不断拓展,结合上手机越来越丰富的传感器,人类行为的量化已经到了粒度极低的程度,特别是社交网络的兴起,对人的情绪、社会网络、行为模式的研究可以极大的脱离实验室环境,反向的消除了研究中的“测不准”现象。
但是尽管数据的颗粒度已经不断细化,对个人或者某个组织的纵向数据的记录已经不断丰富,数据的样本性质还是没有变化,幸存者偏误、自我选择等误差同样存在,一方面抽样数据的分析效果与总体样本可以有一样的精度,另一方面,让我们能够掌握的数据很可能是最容易被保留的,我们之所以认为穴居人住在洞穴中,很可能只是洞穴中的证据被保留了,而网络中的人还是模拟人,数据的规模并不能保障数据的质量。这种大数据嵌套上方法或者研究者谬误的情况,我称之为“大数据”的框架效应,所以数据规模的扩大到降低了消除样本误差的难度,但它们并没有消失。
二、新时代的分析
新的时代,数据的价值在于我们知晓收集它的原因,不然懒于思考现实会让我们陷入点击量、浏览量、访问数等等偷懒的无用指标中,反而浪费了大数据的价值。
为此分析要明确问题,同时借助有效的框架帮助我们选定指标,书中提到了已知未知的四象限分析模型帮助判断机会所在,利用理论类型分类划定指标是属于分析型、预测型、解释型等的哪种,将会帮助我们懂得如何跟踪指标。
而关于分析的应用上本书提出了一个主要观点,将社会科学引入分析之中,提出了社会网络科学及文化分析的应用。
作者已经看到了人类个体与网络间关系的转变,关系网络的研究已经步入新的阶段,这方面的研究就像尚未携取的果实,是真正有着巨大前景的区域;而对文化分析的探讨,已经可以为我们提供和过去那种抽象理解完全不同的具象化的呈现,让我们有了探索概念或者思想观念生命周期的能力,也同时拥有了找到时代趋势的新方法。
三、消费者的数据生活
数据越发丰富的今天,大数据分析给了企业经营中越来越多的好处,但即便如今商业从商品向服务在过渡,商业让“消费者获益”的本质仍旧不会改变,作者提出大数据的运用应该是以消费者的体验为前提的,作者在这里既谈到了如今关于数据讨论激发的用户对数据认识的“禀赋效应”,更提出了“恐怖谷”理论在其中的应用,即消费者对个性化推荐的先程度会随着推荐的精准程度稳步提高,但是当精准达到了一定程度,就会像图二一般迎来一个喜爱上的极具下跌,也就是说个性化的推荐需要一个自我设限,一方面我们对与自我相似需求的东西会存在的一个认知喜好上的阶段性下降,另一方面过于相似虽然可以打破这个认知,但是会增加一个人自我盲目区的展现风险,会使得消费者感受讨厌。
我们已经来到一个关系呈现的菲线性的时代,人与人间关系的恐怖谷,人与企业、品牌关系间的恐怖谷都在向我们展现,认识人性这种先天存在的鸿沟才能帮助我们找到未来社会发展图景可能的样子,但即便在所有可能的未来里,商业的基础都是消费者获益,寄希望于个性化推送或者完全价格歧视创造虚幻的感受是无法长久存在的。
网友评论