第1则
- 前言 -
数据分析是一块知识领域,是一门学科性很强的科目,想要短时间内吃透并不简单,在进入这个领域之前,我们需要学习一些基本的业务常识,结合业务来理解效果会更好。我把数据分析的业务流程整理成一张图帮助大家理解,大致分为「获取数据」、「处理数据」、「数据结果」、「分析原因」、「业务提炼」五大模块。今天着重聊一聊前三个模块,后两个模块会在后面的文段中穿插阐述。
第2则
- 数据库的来源 -
1.数据库(可以从公司内部的数据库抓取想要的数据)
2.数据平台(神策,MTA,talkingdata,诸葛io等等,需要接入自身产品)
3.自建数据平台(大厂或资本较雄厚的公司会有自己的数据平台,另外也有一些开源的可以免费使用,例如「superset」from airbnb)
4.爬虫(这是最常见的一种方式,需要一定的编程基础。一般来说就是技术人员写代码爬取用户,竞对的数据,相应的,也会有反爬虫技术。)
5.市场调研(问卷调查,电话访谈,实地调查)
第3则
- 方法论 -
数据分析大致可以分为:数理性分析和营销(管理)性分析。前者相较于后者更加简便,易上手。后者想要做到精通且灵活运用,则需要大量时间与精力浸淫在工作中,用经验来堆砌功力。数理性数据分析主要针对类似新增用户数,日活月活,留存率,转化率,埋点数据等等进行分析,它又分为:常规分析法,统计模型分析法,自建模型分析法。
为了帮助各位系统的学习数据分析,我把这些理论知识用结构图来表示关系。
为了呼应文章的基础性,今天我们就一起来学习「常规分析法」。常规的数据分析法一般都可以分为:趋势分析,对比分析和细分分析。 接下来我们将用「同环比分析法」「ABC分析法」和「漏斗分析法」来对应说明。
同比
拿某个周期的时间段与上一个周期的相同时间段做比较。例如今年的3月比去年的3月,本周的周三比上周的周一等等。同比增长率=(本期数-同期数)/同期数x100%。觉得有点晕?我们来生动的举个栗子:2016年9月新增245个人关注公众号,2017年9份则有586个人数新增,那么公众号新增关注人数的同比增长率=(586-245)/586x100%=0.58191126x100%四舍五入为60%。
环比
相对更简单,就是拿相邻时间段做比较,不像同比那样在相邻时间段内部某个相同时的间点来对比。环比增长率=(本期数-上期数)/上期数×100%。举个栗子,2017年9月本公众号关注人数新增586人,10月则新增172人,那么公众号新增关注人数的环比增长率=(172-586)/586x100%=-0.70648464x100%四舍五入为-71%。
“ABC分析法又称帕雷托分析法,也叫主次因素分析法,是项目管理中常用的一种方法。它是根据事物在技术或经济方面的主要特征,进行分类排队,分清重点和一般,从而有区别地确定管理方式的一种分析方法。由于它把被分析的对象分成A、B、C三类,所以又称为ABC分析法。”
以上摘自百度,翻译成人话来说,以同一指标为业务对象,进行数量、质量、变量等等分析。以该指标各维度数据与总体数据做对比,按照比重多少排序,将各组成部分分为ABC三类。拿最近发生的事举例吧,2017双11期间,全网的总销售额为1770.4亿元。在分析各电商平台销售额数据中,用ABC分析法对各个平台的销售总额做进一步分析,从图中我们得知天猫,京东的销售额对比全网总销售额来说占比非常大,得出这样的结论之后相关品牌方就可以在运营活动中进一步关注这两个平台,重点在这两个平台上做活动推广,宣发,会大概率获得更大的收益。通过合理分配时间,人力,资源成本到获益概率大的目标(A类)上,是通过数据分析得出的战略规划,但是也不能忽略B类C类,他们只是相比A类应得到较少的投入。
(来自网络)
所有互联网产品、数据分析都离不开漏斗,无论是注册转化漏斗,还是电商下单的漏斗,需要关注的有两点。第一是关注哪一步流失最多,第二是关注流失的人都有哪些行为。关注注册流程的每一个步骤,可以有效定位高损耗节点。
漏斗分析是一套流程式数据分析,它能够反映用户的某段操作路径的全程及转化情况。通过各相关节点数据对比,直观的发现问题所在,从而进行优化。举个我身边的例子:11月份小说书豆收入环比10月份减少了10%,面对这样一个异常的数据指标,我们很难直接判断出那个环节出了问题,尤其是最近还进行了一次频道首页改版,则更难判断了。因此,我们可以采用漏斗分析法来确定用户流失路径:用户从进入频道,到阅读书籍,到书豆付费,到离开页面所有的操作步骤罗列出来,从入口到出口把所有的流程整理成一个分析漏斗,针对每个节点采集关键因素数据,分析哪一步操作上出现了异常,再对其进行优化。最后我们发现,由于一个技术bug导致支付页(问题节点)报错率偏高,许多用户在页面报错后直接离开,因此产生了书豆减少的情况。
(来自及策云课堂)
两张转化率实例图向我们展示:通常转化率过低的节点就是问题节点。加入购物车之前的转化率都较高,但在购物付款的流程中,转化率急剧降低至8%,这里可能就是需要改进的地方。更多关于如何分析问题和解决的方法,推荐阅读:漏斗分析
类似的分析手法还有很多,以下图中的「同期群分析」、「留存分析」、「热力图分析」、「AB测试」等等都可以归纳到趋势,对比和细分这三种分析种类中,感兴趣的同学可以自行检索,我后期文章中也会详细阐述。
(来自GrowingIO)
第4则
- 小结 -
「人」这种生物,有时候连自己,都不知道自己想要的是什么,所以有时候很难去窥探用户的心理,数据的分析与挖掘则用相对更科学,概率更大的方法告诉我们他们的真实意图。「数据」很多时候已经替代了用户在屏幕前的“声音”。不管是产品经理,数据分析师,还是用户研究员,大家职能的核心,是通过研究用户/定义产品来创造价值,数据分析只是一件工具,掌握一定的分析手法是必要的,切莫沉迷于手法,并不是手法越高级分析结果越准确,「合适」才最重要。这两天和某度的小伙伴聊天时她说了一点,越往深了追求数据分析的应用,则越容易陷入凡事都要走一套「数分流」的怪圈,好比明明知道人不吃东西就会饿死,非要用各种,人类生命周期,天灾人祸概率,人体代谢机能等等去证明这一点。对此我想说,人是活的,理论是死的,灵活的选择完成目的的手段,能用10块办成的事没有必要花100块。以明确的分析目的为导向,使用最高效且成本最少的分析手段,得出最科学且最正确的分析结果,辅助问题业务的挖掘和优化,才是做数据分析的终极奥义。
原作者:皮皮Pei
网友评论