在上一篇有关如何学习数据分析的文章中的,我向大家推荐了一本书《如何用数据解决实际问题》,书中所讲到的数据分析逻辑在实际工作中相当好用。
为了能让大家更好地吸收书中的内容,我将其中的核心部分做了提炼,在此以文章的形式呈现给大家。
在拆解的开篇,让我们先来思考一个问题:
我们为什么要做数据分析?
可能会有些同学觉得奇怪,难道这还算一个问题吗?
我给大家讲一个小故事吧
小白是某电商公司的运营人员,刚刚接手工作不久。春节前的某一天,老板把小白叫到了办公室...
老板:小白啊,现在已经是1月了,这样,你去分析一下去年的销售数据,过几天给我一个分析结论。
巧的是,小白前不久刚刚自学了数据分析,对各种分析方法了然于胸!于是乎,小白痛快的回答道:好的老板,没问题!交给我您放心!
接下来,小白就回到了工位,调出了之前数年的销售数据。花费了三天的时间,运用了各种分析方法,形成了一份近万字的数据分析报告,并且附有大量绚丽的图表,显得十分专业。
三天后,小白同学拿着分析报告,信心满满的将报告交给了老板。没成想,老板在翻了几页后就把报告放在了一边,抬头望着小白问道:然后呢?接下来我们要怎么做?你的结论到底是什么?
听到这个问题后,小白同学就傻眼了,心想:啥是然后?你不就是让我去分析数据吗?数据的分析结果不都在报告里写着了么...所有数据都在上面啊,还有这么多图表辅助说明,老板你是瞎吗!你到底想要啥!
当然,这些话小白只敢闷在心里。
沉默了半晌后,小白同学回复老板道:好的老板,我知道了,我这就去改...
大家看到这个故事后是不是有一种很强的既视感?
你是不是也会经常困惑,为什么耗费大量时间与精力完成的数据报告不仅无法得到上级的认可,对工作的结果也起不了什么作用。可是为什么会这样呢?
事实上,在实际工作中大部分所谓的“数据分析”都只是用分析工具来“摆弄”现有的数据。虽然不知不觉做出来很多图表,耗费了大量的时间和精力。但最后所完成的充其量是一份描述数据现象、看图说话的总结报告。
如“2019年度销售收入环比上涨50%,达XXXX万,营销费用环比上涨20%,达XXX万,ROI下降XX%”,只凭这种分析很难找到问题的原因所在。更遑论找到应对措施,得出指导性结论。
为了避免这种情况,在数据分析时,我们不能一见到数据就开始分析,而是必须遵循一定的流程逻辑,才能真正实现问题的解决。
而这个流程就是《如何用数据解决实际问题》这本书的核心观点:
《用数据解决实际问题》的核心逻辑图示从上图可见,数据分析的逻辑流程分为五步:
1)明确目的/问题
2)大致把握现状
3)锁定问题关键
4)锁定问题原因
5)讨论实施对策
同时上图也告诉我们,在数据分析时需要先从广阔的视角出发,逐步聚焦到关键点上,最终实现问题的解决。
接下来让我们来看一下,书中的数据分析逻辑在实际工作中应该怎样执行吧:
明确目的或问题
第一步【明确目的或问题】上文中的小白同学就是在分析过程中忽略了【明确目的/问题】这一步,导致报告被老板直接打回。
但在实际工作中,小白同学的遭遇还不是最惨的!毕竟没有得出结论所损失的只是时间,更恐怖的场景是:在这一步错误的定位了问题,让工作方向走向歧途!
让我们再来看一个故事吧:
老李对A产品利润下降问题的思考还是上个故事中的某电商公司,但这一次的主角换成了有着多年工作经验的老李。某一天,老板将老李叫到了办公室...
老板:老李啊,这几个月A产品的利润下降了不少,你去看看怎么回事。
老李直接回答道:老板,根据我多年的经验,这很可能是最近一段时间降价所导致的。等会儿我去核查一下数据,给您一个准确的回复。
说罢,老李回到电脑前,列出了可能导致利润下降的原因假设和所需数据,经过数据验证果然有所关联!同时,老李还给到了老板一个针对降价问题的详细解决方案。
老板看到老李给出的结论后,满意的夸赞道:不愧是老员工,效率就是高!
但奇怪的是,老李的方案执行一段时间后,A产品的利润并没有得到明显的提升。看到结果后,老板又找到了老李,但这时的老李却没有了开始时的底气,思索了好久也没能给到老板一个明确的答复。
为什么会这样呢?老李的分析到底哪里出了问题呢?
在这个案例中,老李在最初的明确问题阶段给到的假设并不完整,且假设中预设了原因。
老李所有后续的分析只是为了验证最初的假设,如果验证结论能够支持假设就会大大满足。但这个过程很可能忽略其他风险。
能否在分析之初从逻辑上设定合理的问题范围,直接决定了分析的质量。
开端的假设,决定了结论的质量!
那么在明确目的/问题时,我们需要怎样进行假设,才能保证不会陷入误区呢?
答案是:在定义问题、进行假设前,我们需要明确“理想的状态是什么”
设定理想状态之后,我们就可以有意识地将“本质的问题”与“原因”暂且分开考虑,从而尽可能全面的思考问题,进行假设。
从理想状态出发的问题假设按照“先设定理想状态,再进行假设”的方法思考后,我们发现故事中老李所定义的“过度降价”只是导致利润下降的其中一种可能,“假设1”和“假设3”则被直接忽略了。
通过第二个故事,相信大家已经明白在数据分析的开端,进行合理的假设是多么的重要!
避开“问题假设”这个大坑后,我们就可以真正进入数据的统计与分析阶段。
在这一阶段,我们需要将第一步明确的问题进行分解,锁定问题的关键,也就是数据分析流程思维的第二步、第三步。
注:在这一部分的内容中《如何用数据解决实际问题》一书给到了两种假设类型,分别是:“WHAT型-为了比较进行的假设”和“WHY型-为了锁定原因进行的假设”。
但就个人感受来说,我认为这两种假设类型与流程思维之间的关系并不紧密,因此在结合自身的工作/教学经验后,我将这一部分内容进行了重新梳理,下面的部分内容可能与书中顺序有些许差别,还请大家见仁见智。
大致把握现状、锁定问题关键
第二步【大致把握现状】、第三步【锁定问题关键】其实【大致把握现状】与【锁定问题关键】两步流程,正好与数据分析学习路径中的前两步一一对应(数据分析学习路径的链接见文章末尾)。
【大致把握现状】对应着数据指标的选取、拆解(数据建模),用以确定可以分析的数据维度
【锁定问题关键】则需要通过多维度、对比、漏斗等数据分析方法,对建模后的数据进行逐级分析,定位问题所在
例如,仍然是前两个故事中的某电商公司,现在我们发现上个月的GMV指标出现了明显下滑,需要进行深度分析,整体分析思路如下图所示:
GMV指标拆解,锁定问题关键首先,明确上个月的GMV的理想状态是增长10%,达到XXXX万,但实际并未达到目标。
接下来,我们需要先将GMV指标进行逐级拆解,以锁定问题。
将GMV指标按产品系列维度拆解为A、B两类(假设是A是服装,B是鞋包),对比分析后,确认问题在A系列产品,排除B系列产品问题。
继续向下拆解,根据不同的收入产生流程将A系列产品的GMV拆解为【新用户购买】和【老用户复购】,对比分析后,发现二者均有所下降。
【新用户购买】根据来源渠道维度,拆解为【自然用户】与【投放用户】收入,对比后确认问题在于【自然用户】出现下降。
【自然用户收入】以现有的数据无法继续拆解更多维度,则可以按照乘法公式拆解为【自然流量】*【自然流量转化率】(假定客单价不变),对比后锁定问题为【自然流量】。
【老用户复购】与现有数据同样无法继续拆解维度,按照乘法公式拆解为【老用户数量】*【复购率】,对比后锁定问题为【复购率】。
通过上述一系列分析,我们最终就可以锁定导致GMV下降的原因是A系列产品的【新用户自然流量下降】与【老用户复购率下降】这两个问题的关键了。
注:这一拆解过程也对应着书中所说的“WAHT型假设”。
锁定问题原因、讨论实施对策
锁定问题关键后,我们就可以进入到数据分析逻辑的第四步【锁定问题原因】和第五步【讨论/实施对策】了,这两步同时也对应着书中的“WHY型假设”。
第四步【锁定原因】、第五步【讨论实施对策】在锁定原因部分,我们需要引入【影响因素】和【相关性分析】的概念进行分析。
通过刚刚的逐级数据拆解,锁定的关键问题已经拆无可拆了。想要继续分析的话,我们就需要对可能影响【新用户自然流量】和【老用户复购率】的原因进行穷举,在实际工作中这一步往往会通过部门讨论/头脑风暴来完成。
初步拆解后的结果如下图所示:
锁定问题原因-示例每一个分析出的原因,都可以继续深入探究以确认数据变动是否受其影响。
例如【复购率】问题中,我们可以继续探究该月运营人员是否改变了PUSH的频率或内容。如果确认PUSH内容发生变动,则可以尝试对其进行优化,以提升复购率。
如果需要探究的原因有对应的数据指标,则可以引入“相关性分析”进行分析研判,确认数据变动是否与该原因有关。
如【自然流量】的原因推测中,包括【品牌广告投放】这一项。将自然流量变化与品牌广告投放费用进行相关性分析后,我们确认两个数据之间呈现强相关的关系。如果后续确认该月的品牌广告投放费用有较为明显的下降,则可以将之恢复到应有水平,以提升【自然流量】。(相关性分析后续单独开一篇文章,此处就不做拓展了)
品牌广告投放费用与自然流量变化趋势图以上五步就是《如何用数据解决实际问题》一书中的核心内容:数据分析的流程思维,也是用数据分析解决问题的基本逻辑。
其实仔细想想,数据分析的流程与医生为患者看病的流程有很多共同点。无论解决什么问题,都需要这样一步步的锁定对象,摸清原因,最终实现问题的解决。
数据分析流程与医生看病的共同点不过实际工作中,我们未必能直接获得自己所需的数据,常常需要对分析的思路/假设进行反复调整。将事实与逻辑一层层积累起来,这个过程对任何问题来说都是相同的。
结论呈现:用数据讲好故事
在《如何用数据解决实际问题》这本书的最后,作者还针对“结论呈现:用数据讲好故事”进行了一些论述。
毕竟即使我们的分析逻辑再严谨,但却无法在汇报时说服领导、拿到资源,问题还是无法得到解决。
很多初学数据分析的同学,在汇报时往往习惯将分析流程从头到尾进行表述,详细汇报自己每一步的分析思路。
不能说这种方式不对,但如果你面向的汇报对象是老板或高层时,由于他们的时间很有限,可能还不到几分钟,现场就会陷入“你到底想说什么”的尴尬气氛。
因此在面对这种情况时,建议大家先进行结论的陈述(针对问题需要采取的措施、需要的资源支持等),再补充这样做的原因,过程中针对领导关注的重点给到数据的支持。
汇报时并不需要我们把所有内容全部表述,而是要在汇报前重点思考“要表达的核心信息是什么”、“对方想知道什么”,才能让汇报获得最佳的效果。
数据汇报,结论先行今天的分享就是这些,谢谢大家!
如果看完本文后你觉得有所收获,就请点个关注吧!也可以将知识分享给更多的人!
往期文章回顾
网友评论