一、留存概念
用户留存指的是新会员/用户在经过一定时间之后,仍然具有访问、登录、使用或转化等特定属性和行为,留存用户占当时新用户的比例就是留存率。留存率按照不同的周期分为三类,以登录行为认定的留存为例:
第一种 日留存,日留存又可以细分为以下几种:
(1)次日留存率:(当天新增的用户中,第2天还登录的用户数)/第一天新增总用户数
(2)第3日留存率:(第一天新增用户中,第3天还有登录的用户数)/第一天新增总用户数
(3)第7日留存率:(第一天新增用户中,第7天还有登录的用户数)/第一天新增总用户数
(4)第14日留存率:(第一天新增用户中,第14天还有登录的用户数)/第一天新增总用户数
(5)第30日留存率:(第一天新增用户中,第30天还有登录的用户数)/第一天新增总用户数
第二种 周留存,以周度为单位的留存率,指的是每个周相对于第
一个周的新增用户中,仍然还有登录的用户数。
第三种 月留存,以月度为单位的留存率,指的是每个月相对于第
一个周的新增用户中,仍然还有登录的用户数。
留存率是针对新用户的,其结果是一个矩阵式半面报告(只有一半有数据),每个数据记录行是日期、列为对应的不同时间周期下的留存率。正常情况下,留存率会随着时间周期的推移而逐渐降低。
二、注意事项
在应用留存分析时,需要注意以下几个问题:
(1)区别应用不同留存周期。日留存用来做短期结果、周留存用来看中期效果、月留存用来看长期效果。
(2)在留存中注意观察和分析衰减比率,正常情况下的留存会随着时间逐渐衰减,这种衰减趋势可能呈线性、指数性甚至二项式等不同趋势,通过衰减数据可以得到衰减模型,这些模型可以用来做衰减异常检测,以发现哪些时间的衰减存在异常(通常是过渡衰减)。
(3)注意分析运营活动对于留存的影响,在没有较大的运营活动时,留存的衰减会存在一定规律;但当运营采取一定活动时可能会导致留存率的提升,而这种提升应该是预期内的。如果留存中没有反映出提升趋势,需要多方面总结运营活动效果。
三、案例示范
1.需求描述
交易记录表:dw.t_trade_temp
字段:f_merchant_id 商户ID,f_time 交易时间
计算次日留存率,3日留存率,7日留存率,月留存
2.日留存计算(hivesql)
select c.min_trade_date `首次交易日期`,
max(if(datediff(c.trade_date,c.min_trade_date)=0,merchant_count,0)) as `首次交易商户数`,
max(if(datediff(c.trade_date,c.min_trade_date)=1,merchant_count,0)) as `次日留存商户数`,
max(if(datediff(c.trade_date,c.min_trade_date)=2,merchant_count,0)) as `3日留存商户数`,
max(if(datediff(c.trade_date,c.min_trade_date)=6,merchant_count,0)) as `7日留存商户数` ,
concat(cast(round(max(if(datediff(c.trade_date,c.min_trade_date)=1,merchant_count,0))/max(if(datediff(c.trade_date,c.min_trade_date)=0,merchant_count,0)),2) as string),'%') as `次日留存率`,
concat(cast(round(max(if(datediff(c.trade_date,c.min_trade_date)=2,merchant_count,0))/max(if(datediff(c.trade_date,c.min_trade_date)=0,merchant_count,0)),2) as string),'%') as `3日留存率`,
concat(cast(round(max(if(datediff(c.trade_date,c.min_trade_date)=6,merchant_count,0))/max(if(datediff(c.trade_date,c.min_trade_date)=0,merchant_count,0)),2) as string),'%') as `7日留存率`
from
(select
a.min_trade_date,
b.trade_date,
count(1) merchant_count
from
(select
f_merchant_id,
to_date(min(f_time)) min_trade_date
from
dw.t_trade_temp
group by
f_merchant_id
) a
inner join
(select
distinct f_merchant_id,
to_date(f_time) trade_date
from
dw.t_trade_temp
) b
on
a.f_merchant_id=b.f_merchant_id
group by
a.min_trade_date,b.trade_date
) c
group by
c.min_trade_date
order by c.min_trade_date desc
得到结果:
image.png3.月留存计算
select
a.min_trade_month as `首次交易月份` ,
b.trade_month as `交易月份` ,
count(1) as `交易商户数`
from
(select
f_merchant_id,
substring(min(f_time),1,7) min_trade_month
from
dw.t_trade_temp
group by
f_merchant_id
) a
inner join
(select
distinct f_merchant_id,
substring(f_time,1,7) trade_month
from
dw.t_trade_temp
) b
on
a.f_merchant_id=b.f_merchant_id
group by
a.min_trade_month,b.trade_month
得到结果:
image.png
透视表调整转换之后可以得到如下:
image.png
网友评论