美文网首页动起来吧废柴们!
避免大数据分析中相关性的误读

避免大数据分析中相关性的误读

作者: 临岸观潮雨 | 来源:发表于2017-06-28 23:57 被阅读14次

    《大数据时代》文中提到大数据时代最大的转变是放弃对因果关系的渴求,而关注相关关系。这似乎意味着只要有足够的数据支持,我们甚至不需要理解事物就能做出决策。

    或许未来的某一天我们的世界基本智能化之后可能有机会实现,但就目前而言,这样的观点存在一定的风险。目前我们的数据采集受限于已有认知与技术,一方面只能采集我们认为重要的数据,另一方面无法做到把所有决策相关的内外数据均进行采集,这就导致我们的数据始终是不全面,甚至是有偏得。比如评论数据,沉默的大多数人未必跟评论活跃的人保持相同的意见,而我们根据评论区用户的意见进行修改很可能适得其反。

    比如当年魔兽世界中,由于数据中反映的组队难易度与满意度的有相关关系,因此设计随机组队模式来改善该问题,但上线后却造成玩家交流大幅度减少,严重破坏已有社交属性。但是同样地问题和解决方案,王者荣耀却取得了惊人的成功。究其原因是游戏属性不同,用户心智模式不同,而这些目前而言却无法用数据来表述。

    因此,即使是大数据时代,我们也不能放弃借助用户研究探寻数据背后的因果关系,通过准确定位因果关系,再来进行产品优化决策。

    比如前段时间,我们在做一个研究过程中发现,语音留言产品的用户中,用户修改应答语的行为与订购行为存在相关性,我们不能简单地认为通过活动促使用户修改应答语就能提升订购。因为用户会修改应答语,或许是因为他想借此提升留言率,但更可能是尝鲜型用户自带的行为特征,如果是后者基本上是不可能通过活动来实现转变。而就已有的数据而言,是无法告诉你真实地原因的。

    而同样更早前的一次应用商城的调研,我们发现了用户的下载率与搜索行为有非常强的关联性,这不能说明用户有搜索行为就更容易下载。通过研究发现,是因为用户对应用探索已经倦怠,更多是有明确目标的下载。预期通过活动让更多用户去搜索,不如花更多时间去优化搜索,提升搜索下载的转化率。

    总之,虽然大数据比以往具有更大的挖掘价值,但正确地解读才是关键。

    相关文章

      网友评论

        本文标题:避免大数据分析中相关性的误读

        本文链接:https://www.haomeiwen.com/subject/ulcxfxtx.html