四年来,用过一些统计系统,Google Analytics、百度统计、友盟统计(原cnzz),但从没想过这些数据指标是怎么计算来的,什么是活跃,弹出率是怎么计算的。
今天上了门课,学习了下数据指标,发现有一些指标跟以前想的不一样,做个笔记。
没有绝对的对错,只求彼此的认同。
每个公司、或者细化到个人,可能对一些数据指标认知都不同,但是这些认知不分对错,先沟通好才是王道。
活跃的定义
以前的我把统计系统给出的活跃用户(active user),看作是访问了网页有一段时间的用户,今天才知道,我这个认知可能是错的。
有个例子:
小明负责一个APP运营。有一天,小明发现DAU从周三开始到周五急剧增加,小明很高兴,但也开始找DAU急剧增加的根源。这几天是节日?不是,这几天做了很大的运营动作?也没有。小明百思不得其解,请教了下其他人。后来才知道,DAU急剧增加的原因是前几天增加了对push到达的统计。逻辑就是当用户手机收到这个push,会上报给数据统计系统收到push了。只要是push到达到用户手机,即使是没打开app,这个事件也会上报,导致DAU增加。
现在我才知道,大部分数据统计系统是基于事件上报来判断=》该用户活跃。
这个事件有很多种,但是只要match匹配到一种,系统就判断活跃用户。所以会出现上面例子,即使没打开app,统计系统仍判断为活跃。
如何解决这个问题:
可以建立个「日活事件列表」,例如把访问首页、访问商品详情页这些事件添加到日活事件列表里。
缺点就是,需要有一个人日常维护,增加了人力资源成本,且需要定期通知团队成员,列表添加了哪些事件。
留存
日留存率的计算有以下算法:
算法一: * 100% ------七日日留存
算法二: * 100% ------七日内留存
算法三: * 100%------七日日留存
算法没有优劣,看适合哪些场景。
算法一,是七日日留存,相较于算法二,更适合用来了解某一个渠道的质量。我们判断一个渠道质量可以用最近的一个周期和上一个周期效果比较。只需要简单粗暴的计算下七日日留存就可以判断了,去重了,反而不好。
算法二,更适合有固定使用周期,且使用周期较长的业务。
算法三,算法三和算法一的区别,是分子从第1天变成了第0天。我们可以看下日历,如果星期一是第1天,则星期天是第7天。第0天则是上一个星期天。算法三的好处是去掉了星期的影响。
还有周留存/月留存,适合观察大盘。
访问深度
算法一:用户对某些关键行为的访问次数
算法二:将网站内容分级,例如分成首页、列表页、文章页,以用户访问最深的一层计算
访问时长
「用户离开了,页面没关掉」这种情况会影响用户真实访问时长的计算,我们可以统计特殊事件,例如视频播放暂停所在的进度条时长作为用户访问时长。
弹出率
可能很容易有一个认知,用户点开一个页面,关掉了,就算弹出了。
而大部分统计系统,对弹出率的计算不是上面的按页面弹出计算。
而是基于单个用户只访问一个页面而弹出。如果这个用户是从一个页面进入到这个页面再弹出的,就不算弹出。
呼~写了一个小时,如果有误,麻烦下方留言~
参考:
1.【三节课·互联网业务数据分析实战】
网友评论