数据分析体系构建

作者: 不二翔叔 | 来源:发表于2018-10-06 11:17 被阅读198次

    一、数据分析的目的

    1.验证产品模式是否可行

    2.验证用户对产品功能的满意度

    3.挖掘新的需求,帮助产品、运营进行迭代

    二、数据分析流程

    1.数据采集

    友盟+事件埋点

    2.数据清洗

    Excel清洗

    3.数据分析

    Excel + SPSS

    4.数据可视化

    Excel图表

    5.数据迭代

    三、数据分析工具

    四、数据分析指标

    1.定性指标vs量化指标

    2.探索性指标vs报告性指标

    3.先见性指标vs后见性指标

    4.相关性指标vs因果性指标

    5.虚荣性指标vs可付诸行动指标

    ①整体

    北极星指标:核心指标

    一级指标:衡量公司战略和目标

    二级指标:一级指标的路径

    三级指标:二级指标的路径

    AARRR模型:

    A:用户获取

    渠道相关:

    渠道规模、访问量、访问用户量、拉新能力、新访问用户量、新访问用户量/访问用户总量、渠道质量、访问时长、每次会话浏览页面数、跳出率、用户注册转化率、用户其他转化率、渠道留存率

    激活相关:

    下载量:已下载应用的用户数量,以及应用商店排名和评分

    安装激活量:安装并打开应用的设备数

    激活率:激活设备数/安装设备数

    新增用户数:新增设备的数量(激活数量,唯一)

    注册用户数:所有激活用户中注册成功的用户占比

    用户获取成本:每获取一个用户所需要的费用

    抛出一个疑问:何为真正的激活?

    安装之后打开就算激活吗?注册成功就算激活吗?还是必须得首次体验到产品核心功能才算激活?

    A:用户活跃

    产品使用规模:

    日活、周活、月活跃用户量:一段时间内启动过应用的设备数,表示用户规模

    访问量,启动次数:启动应用的次数

    活跃系数:日活跃用户数/月活跃用户数(大于0.2比较合适)

    平均使用时长:平均每个用户一天使用应用的时间

    功能使用率:使用某功能的用户数占活跃用户的比例

    新手引导效率:

    新手任务完成率

    新手任务完成耗时

    用户活跃度:

    活跃访次/全部访次

    各模块用户活跃度

    产品转化率:

    核心流程转化率

    核心转化步骤流失率

    R:用户留存

    N日留存计算:统计日期新增的用户或活跃用户,在第N天又来使用的比例。

    次日留存率

    7日留存率

    30日留存率

    产品留存率:

    核心产品功能留存率

    抛出一个疑问:当留存率非常低时,如何利用指标发现问题?

    次日留存比较低时,说明用户对我们的产品不感兴趣,或者说我们的产品做得太差

    7日留存比较低时,说明用户觉得我们的内容不耐玩,不好玩

    30日留存比较低时,说明我们的版本迭代规划做得不够好,没有及时给用户更新内容

    R:获取收入

    销售额、转化率

    R:用户传播

    推荐用户数量

    推荐用户/全部线索用户

    NPS

    K因子

    口碑指数(百度,谷歌)

    ②局部

    1.产品每一个具体功能的用户体验评估

    heart模型:

    2.产品每一个具体业务的指标

    电商类:

    UGC内容类:

    游戏类:

    平均同时在线人数(ACU: Average concurrent users):即在一定时间段抓取一次数据,以一定周期为期限;周期内的ACU可取时间段的平均数据。[例如:系统每一小时抓取一次数据,全天24小时共24个不同时刻的在线数据,则每天的ACU是这24个数据的平均值(每个公司有每个公司的定义,一般ACU取平均值,若针对某一时刻,则直接在某时刻内直接统计用户数)

    最高同时在线人数(PCU:Peak concurrent users)即在一定时间内,抓取最高在线数据。(例如:单天最高在线:系统每小时统计一次数据,全天24小时共24个不同时刻的在线数据,则24个时间段内最高的用户在线数据为PCU)

    充值金额(RMB):即在一定周期内充值总金额。

    元宝消费金额(RMB):即在一定周期内,玩家在游戏商城中的消费总金额(仔细看,充值金额与元宝消费金额有着明显区别,上者受活动影响,下者受商城道具需求影响。)

    每付费用户平均收益(ARPPU: Average Revenue Per Paying User):相似于下载游戏的消费比率,(国内很多人以“ARPU”称呼,个人定义不同),此类数据主要衡量付费用户收益(公式:月总收入/月付费用户数)

    平均每活跃用户收益(ARPU: Average Revenue Per User):主要衡量游戏整体贡献收益;毕竟除了付费收益,活跃用户也能产生收益,(一般国内以此数据为核心,各家算法不同)(公式:月总收入/月活跃用户)

    平均生命周期:有新增账户在首次进入游戏到最后一次参与游戏的时间天数。比如记录某一个月,这个月里,每个新增用户的生命周期之和/MAU=平均生命周期。

    LTV生命周期价值(LTV: Life Time Value):约定一个计算的生命周期值(比如上个月的平均生命周期,或者约定为15日,即这个月有15日登陆记录的账户数),符合这个生命周期条件的账户数中,充值金额的和/条件账户数。

    每日注册并登陆的用户数(DNU: Daily New Users):这个言简意赅,就不详谈了,直接从后台抓取即可。

    新登用户中只有一次会话的用户(DOSU: Daily One Session Users):这个也很简单,此类数据主要衡量新用户的质量,买量的可以参考一下。

    每日登陆过游戏的用户数(DAU: Daily Active Users):直接从字面就能了解了,一般从后台抓取。

    七天内登陆过游戏的用户数(WAU: Weekly Active Users):这个还是很好理解,就不废话了,此类数据主要衡量周变化。

    30天内登陆过游戏的用户数(MAU: Monthly Active Users):浅显易懂,主要衡量产量的粘性以及用户的稳定性。

    四、数据分析中的误区

    1.忽略沉默用户

    2.过度依赖数据

    3.错判因果关系

    4.通过数据表达方式欺骗

    5.妄谈大数据

    五、数据分析方法

    从统计学的角度看:

    按照难易程度分为:基础统计分析、高级统计分析、数据挖掘方法。

    常见的分析方法有如下:

    ①画像分群:聚合符合某种特定行为/画像的用户,聚类分析

    ②趋势分析:实时快速了解多维度趋势,便于进行产品、市场迅速迭代

    ③对比分析:与竞争对手比,与过去的自己/版本比

    ④交叉分析:多维度交叉分析

    ⑤漏斗分析:按照已知转化路径,分析每一步骤转化情况

    ⑥回归分析:预测性的建模技术,研究因变量和自变量之间的关系

    ⑦聚类分析:物以类聚,人以群分,将相似或距离相近的对象/数据归为一类

    ⑧相关性分析:对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度

    ⑨行为事件分析/用户路径分析:探索性了解某组用户的行为轨迹

    ⑩留存分析:了解行为/行为组与回访之间的关联

    ⑩①A/B测试:对比不同产品设计/算法对结果的影响

    ⑩②优化建模:建立预测模型优化商业结果

    六、数据分析框架/思维

    ①AARRR模型

    不解释了。

    ②逻辑分层拆解

    七、数据应用的场景

    产品设计前:通过数据分析发现问题

    产品设计中:辅助决策,判断思路(A/B测试)

    产品设计后:数据验证方案

    数据驱动产品闭环

    所谓的数据驱动,其实就是一套量化的发现问题和解决问题的流程,在产品设计的重要环节,数据都在发挥着主观臆断无法替代的作用。

    八、回归实际,解决重要的三个问题

    ①数据如何科学的采集?(关于埋点方式的探讨)

    目前市面上有的埋点方式主要是三种:

    a.可视化/全埋点

    所谓全埋点,就是在产品中嵌入一段SDK,做一个统一的埋点,也叫“无埋点”。

    优势:

    可视化展示宏观指标,满足基本的数据分析需求;技术门槛较低,使用与部署较简单;用户友好性强

    缺陷:

    只能采集到用户交互数据,自定义的某些属性无法采集;无埋点兼容性有限,同一按钮可能出现不同名称,造成混乱;属于前端采集的方式,有天然的缺陷,如数据采集不全面、传输时效性差、数据可靠性无法保障等。

    b.代码埋点

    又分为前端代码埋点和后端代码埋点。前端类似全埋点,所不同的是,对于每一个关键行为,都需要调用SDK,将必要的事件名、属性字段写入代码;后端代码埋点则将相关的事件、属性等通过后端模块调用SDK的方式,发送到后台服务器,这种方式更适合安全性要求高、精细化分析的场景,如金融服务。

    c.导入辅助工具

    还可以采用日志、数据库的方式生成数据,然后对数据进行转换,通过实时或批量工具完成数据的导入。

    那么,如何选择合适的采集方式呢?因企而异。

    一般三种都是结合起来用的,只不过看全埋点是用第三方现成的,如友盟、神策数据、growthingio等,还是用官方自己搭建数据分析平台,这要根据公司具体业务来定。

    ②一款产品在什么时期就要开始做埋点工作了?(尤其是早期冷启动产品)

    建议在早期就要有数据分析体系搭建的意识,可能暂时还用不上,如果产品验证还不错,公司资源又跟的上,那建议尽早去做。

    ③数据深度挖掘算法

    现在大家都在谈大数据,大数据该怎么做?怎么智能化?有以下几个方向:

    a.决策树模型

    b.神经网络

    c.机器学习

    因为涉及的领域太深、太难,此处不做过多分析。

    九、扩展:如何培养数据分析能力

    ①心法层面

    1.好奇心

    2.求知欲

    宽广的胸怀,敢于打破常规和局限。

    ②基础层面

    基础指标:pv、uv、跳出率、转化率、点击数等

    学习网站:

    http://bluewhale.cc/

    书籍:

    《统计数据会撒谎》

    《深入浅出数据分析》

    《谁说菜鸟不会数据分析》

    《赤裸裸的统计学》

    《深入浅出统计学》

    《MySQL必知必会》

    《流量的秘密》

    《数据之美》

    《精益数据分析》

    《利用Python进行数据分析》

    ③对业务足够了解

    ④重视数据,保持敏感

    时刻关注数据,时刻反思优化

    相关文章

      网友评论

        本文标题:数据分析体系构建

        本文链接:https://www.haomeiwen.com/subject/sqacaftx.html