商业数据分析的本质,是从繁杂的数据中提炼有洞察的见解,并用可视化的方法呈现出来。
在这个过程中,你需要有能力利用高效的工具,把数据中的噪音清理掉。
通过分析得出数据反馈的规律,基于此提炼真正的洞见,并选择合适的方法呈现数据和结论,清楚地支撑你的观点。
这里的要点有三个:
正确的问题/假设,清晰的分析思路
掌握分析工具,能够利用工具提高数据分析的能力和效率
使用可视化的数据分析工具,帮助自己更好地传达分析结论
透过数据,你可以:
- 发现规律(早上 10:00 发送营销邮件打开率最高)
- 解释现象(为什么新上线的产品功能导致次日留存 20% 的提升?)
- 验证假设(100 万的外卖补贴应当分配 80% 在高校商圈,原因是这部分消费者对价格更加敏感)
- 创造机会(CVS 的无糖酸奶销量连续 2 年上升,建议公司明年推出低糖款乳酸菌饮料)
- 讲好故事(更优雅地说服老板、客户和同事)
Learning by doing :
思维篇🎓
1.结构化思维
做数据分析,首先你得具备看待一个事物的逻辑化思维,其次用数据去证明他。
我们会经常听说两种推理模式,一种是归纳,一种是演绎。这也是麦肯锡思维当中很经典的两个方法,工作中所有的问题,都可以用归纳或者演绎的形式进行拆分.
这两种思维模式能够帮助数据分析师完成原始的业务逻辑积累,在此基础上快速定位业务问题,提升分析效率。
现在有一个线下销售的产品。我们发现8月的销售额度下降,和去年同比下降了20%。
我想先观察时间趋势下的波动,看是突然暴跌还是逐渐下降。再按照不同地区的数据看一下差异,有没有地区性的因素影响。我也准备问几个销售员,看一下现在的市场环境怎么样,听说有几家竞争对手也缩水了,是不是这个原因。
用结构化思维梳理,就是:
某自营电商网站,现在想将商品提价,让你分析下销售额会有怎样的变化?
首先可以确定销量会下降,那么下降多少?这里就要假设商品流量情况,提价后转化率的变化情况,然后根据历史数据汇总出销量下降的情况,从而得出销售额的变化情况。
假设商品提价后,销量一定会下跌,问题是销量下跌多少?
首先假设流量不会有变化,流量和渠道营销正相关,商品价格影响转化率,那么现在确定转化率的波动。
找出平时的转化率(譬如为20%),预估提价后的转化率变化。假设各类型用户对价格敏感度不同,那么将用户划分忠诚XX、普通XX、羊毛XX..…
不同用户层次数量不同,反应不同。忠诚用户转化率变化极低,羊毛几乎不会转化.…这些数据可以凭借经验做出假设,最后汇总。
归纳和演绎的思维是数据分析初期必备的,面试考察逻辑思维也无非是这两点。实际情况中可针对不同的项目要求进行组合应用。在经过一定阶段的训练后,可以帮助提升业务熟悉程度,完成业务的初始积累后,后续的分析过程中就可以逐步减少拓展推理的层级及组合,逐步提升问题原因定位的效率。
2.指标化思维
假设有一家电商公司,我们想要了解网站运营的情况如何?运营人员向我们描述,我们的网站的流量很高啊,比淘宝差一点,比京东好一点,每天都有大量的新用户,老用户下单也很活跃啊。
这样的问题相信只能凭运营人员的经验来判断,而经验带来的“后果”往往是拍脑袋式的决策。
如果用指标化的思维,应该用PV和UV去衡量流量,新用户下单数和占比去评价网站的拉新,新老买家占比等指标去衡量用户活跃。
很明显,指标就是用来定义、评价和衡量业务的一个标准。比如网站相关用户访问量、停留时长、跳出率等。销售相关销售量、销售额、客单价等。
指标的设定有两个经验:
A.“有总比没有强”。对于要监控的事物,能有指标的尽量要有指标。
B.“一个好的指标应该是用来衡量具体且可量化的事物”。比如,用户访问量、停留时长、跳出率等。
下面这张图,解释了什么是指标化,这就是有无数据分析思维的差异,也是典型的数据化运营。
有指标是否就够了呢?指标按照结构化思维可以形成一个体系,如销售分析指标体系,生产指标体系,电商行业指标体系。
一家企业建立的数据分析体系通常细分到了具体可执行的部分,可以根据设定的某个指标异常变化,相应立即执行相应的方案,来保证运营的正常进行。
建立指标体系的思路:
向上
可以按业务职能结构划分,映射出更多维度,比如渠道,运营,产品等相关模块,将相关指标映射到主要模块,通过简单快速的沟通,快速定位问题原因。
向下
可以按因果结构划分,也就是指标分解,利用公式的方法。比如营收=日活*付费率*arpu等指标因果关系进行划分,通过定位指标波动,定位最细指标,辅助维度下转,能够清楚的问题原因。
就像枝丫一样,从主干不断延伸,将业务用指标评价量化,逐渐形成一个健全的数据分析体系。
3.维度分析
当你有了指标,可以着手进行分析,数据分析大体可以分三类,第一类是利用维度分析数据,第二类是使用统计学知识如数据分布假设检验,最后一类是使用机器学习。这里我们主要了解维度分析法。
维度是观察数据的角度,例如“时间”、“地区”、“产品”。在具体分析中,我们可以把它认为是分析事物的角度。时间是一种角度、地区是一种角度,产品也是一种角度,所以它们都能算维度。
当我们有了维度后,就能够通过不同的维度组合,形成数据模型。数据模型不是一个高深的概念,它就是一个多维立方体。
数据按照事实表(Fact Table)和维表(Dimension Table)的形式存在。事实表用来记录具体事件,比如销量、销售额、售价、折扣等具体的数值信息。维度表是对事实表中事件的要素的描述信息,比如时间、城市、品牌、机型等。
事实表里面主要包含两方面的信息:维和度量。维的具体描述信息记录在维表,事实表中的维属性只是一个关联到维表的键,并不记录具体信息;度量一般都会记录事件的相应数值,比如这里的产品的销售数量、销售额等。维表中的信息一般是可以分层的,比如时间维的年月日、地域维的省市县等,这类分层的信息就是为了满足事实表中的度量可以在不同的粒度上完成聚合,比如2016年商品的销售额,来自上海市的销售额等。
在数据分析中,数据分析思维是框架式的指引,实际分析问题时还是需要很多“技巧工具”的。就好比中学里你要解一元二次方式,可以用公式法、配方法、直接开平方法、因式分解法。
数据分析里也有技巧,在一些通用的分析场景下可以快速使用,而且对未来构建数据分析模型也有帮助。
常见的5种数据分析方法分别是:公式法、对比法、象限法,二八法,漏斗法,常常多种结合一起使用。
1.公式法
所谓公式法就是针对某个指标,用公式层层分解该指标的影响因素,这个我在指标化思维中提到过。
举例:分析某产品的销售额较低的原因,用公式法分解
某产品销售额=销售量 X 产品单价
销售量=渠道A销售量 + 渠道B销售量 + 渠道C销售量 + …
渠道销售量=点击用户数 X 下单率
点击用户数=曝光量 X 点击率
通过对销售额的逐层拆解,细化评估以及分析的粒度。
公式拆解法是针对问题的层级式解析,在拆解时,对因素层层分解,层层剥尽。
2.对比法
我们知道孤立的数据没有意义,有对比才有差异。一些直接描述事物的变量,如长度、数量、高度、宽度等。通过对比得到比率数据,增速、效率、效益等指标,这才是数据分析时常用的。
比如用于在时间维度上的同比和环比、增长率、定基比,与竞争对手的对比、类别之间的对比、特征和属性对比等。对比法可以发现数据变化规律,使用频繁,经常和其他方法搭配使用。
3.象限法
通过对两种及以上维度的划分,运用坐标的方式表达出想要的价值。由价值直接转变为策略,从而进行一些落地的推动。象限法是一种策略驱动的思维,常于产品分析、市场分析、客户管理、商品管理等。
比如,下图是一个广告点击的四象限分布,X轴从左到右表示从低到高,Y轴从下到上表示从低到高。
还有经典的RFM模型,把客户按最近一次消费(Recency)、消费频率(Frequency)、消费金额 (Monetary)三个维度分成八个象限。
象限法的优势:
1.找到问题的共性原因
通过象限分析法,将有相同特征的事件进行归因分析,总结其中的共性原因。例如上面广告的案例中,第一象限的事件可以提炼出有效的推广渠道与推广策略,第三和第四象限可以排除一些无效的推广渠道;
2.建立分组优化策略
针对投放的象限分析法可以针对不同象限建立优化策略,例如RFM客户管理模型中按照象限将客户分为重点发展客户、重点保持客户、一般发展客户、一般保持客户等不同类型。给重点发展客户倾斜更多的资源,比如VIP服务、个性化服务、附加销售等。给潜力客户销售价值更高的产品,或一些优惠措施来吸引他们回归。
4.二八法/帕累托分析
二八法也可以叫帕累托法则,源于经典的二八法则。比如在个人财富上可以说世界上20%的人掌握着80%的财富。而在数据分析中,则可以理解为20%的数据产生了80%的效果需要围绕这20%的数据进行挖掘。往往在使用二八法则的时候和排名有关系,排在前20%的才算是有效数据。二八法是抓重点分析,适用于任何行业。找到重点,发现其特征,然后可以思考如何让其余的80%向这20%转化,提高效果。
一般地,会用在产品分类上,去测量并构建ABC模型。比如某零售企业有500个SKU以及这些SKU对应的销售额,那么哪些SKU是重要的呢,这就是在业务运营中分清主次的问题。
常见的做法是将产品SKU作为维度,并将对应的销售额作为基础度量指标,将这些销售额指标从大到小排列,并计算截止当前产品SKU的销售额累计合计占总销售额的百分比。
百分比在 70%(含)以内,划分为 A 类。
百分比在 70~90%(含)以内,划分为 B 类。
百分比在 90~100%(含)以内,划分为 C 类。
以上百分比也可以根据自己的实际情况调整。
ABC分析模型,不光可以用来划分产品和销售额,还可以划分客户及客户交易额等。比如给企业贡献80%利润的客户是哪些,占比多少。假设有20%,那么在资源有限的情况下,就知道要重点维护这20%类客户。
5.漏斗法
整体漏斗模型的核心思想其实可以归为分解和量化。比如分析电商的转化,我们要做的就是监控每个层级上的用户转化,寻找每个层级的可优化点。对于没有按照流程操作的用户,专门绘制他们的转化模型,缩短路径提升用户体验。
还有经典的黑客增长模型,AARRR模型,指Acquisition、Activation、Retention、Revenue、Referral,即用户获取、用户激活、用户留存、用户收益以及用户传播。这是产品运营中比较常见的一个模型,结合产品本身的特点以及产品的生命周期位置,来关注不同的数据指标,最终制定不同的运营策略。
通过拆解和量化整个用户生命周期各环节,可以进行数据的横向和纵向对比,从而发现对应的问题,最终进行不断的优化迭代。
网友评论