美文网首页
【数据处理】基于留存预测日活

【数据处理】基于留存预测日活

作者: 胖胖的Jane | 来源:发表于2021-08-25 11:22 被阅读0次

    1、前言:本篇目的在于介绍一种数据预测方式,帮助大家在遇到实际业务需求时找到解决方案!如有不清晰之处,欢迎指正探讨~

    假定你的老板,给你这样一个任务,你是否知道怎么解决?老板:小丽,做一个日活预测,看看按照当前策略增量情况下,到年底我们的日活是否能达到400万?如果你对这个问题,不知道如何下手,那么本篇内容,将对你有所帮助~

    2、解决方案:

    DAU=新用户活跃用户数+老用户活跃用户数(下文的预测,仅介绍对于增量部分的日活预测,存量用户需要考虑时间衰减因素,相较更为复杂,不在本次分享讨论范围)

    第2日活跃用户数=第2日新增用户数+第1日留存用户数(其中:第1日留存用户数=第1日新增用户数*第1日留存率)

    第3日活跃用户数=第3日新增用户数+第2日留存用户数+第1日留存用户数(其中:第2日留存用户数=第2日新增用户数*第2日留存率)

    ....以此类推

    第30日活跃用户数=第30日新增用户数+第29日留存用户数+第28日留存用户数+第27日留存用户数...+第1日留存用户数(其中:第2日留存用户数=第2日新增用户数*第2日留存率)

    设:DAU(n)为第n天的日活,A(n)为第n天的新增,R(n-1)为第n-1天的留存率。则:DAU(n)=A(n)+A(n-1)R(n-1)+A(n-2)R(n-2)+... ...+A(1)R(1)

    假设每日的新增用户数是一个固定值,那么基于上面的公式,唯一需要确定的变量则是第1日-第n日,每日的留存率。

    留存率怎么求?

    大部分产品的留存衰减曲线,基本都是符合幂函数曲线。我们可以通过幂函数来近似拟合留存率的衰减曲线,也就可以顺利的预估出日活模型中需要的留存之和。

    案例:假设现在7月1日,我们现有数据如下,第1日留存率、第7日留存率、第14日留存率、第30日留存率,需要我们预测到今年底的日活数据。(下发截图数据,为作者整理的虚拟数据,不代表任意业务数据)

    解:

    第一步:在excel借助散点图,用已有数据,绘制一个幂函数曲线,得到公式:y = 0.3325x-0.36,其中R的平方=0.9976,一般来说R的平方超过60%,这个结果可以用,越接近1,其结果也越与真实情况接近。因为7月1日-12月31日,相距183天,留存率预测超过50天,其实第≥50日的留存率,可以简单采用一个恒定的值,如下图是模拟的一个处理过程。

    第二步:假设每日新增用户数固定是100000,现在我们可以通过每日留存率,来预测每日活跃用户数。每日留存率*每日新增用户数=每日活跃用户数(下文的预测,仅介绍对于增量部分的日活预测,存量用户需要考虑时间衰减因素,相较更为复杂,不在本次分享讨论范围)以下是操作执行的细节:

    表单解释:横坐标第1行,是7月1日-12月31日,每天的日期,第二行是第N天,7月1日-12月31日是183天,因此是1-183,第3行是上一步我们预测出来的每日留存率,将它填充到这个sheet表单即可。D4=C4*D3、E4=C4*E3、....,一直算到第183天后的月活,即GD4=C4*GD3,最后我们将第183天的活跃用户数=第183天新增用户数+(1-182天的留存用户数),计算得出的结果就是第183天的日活了,如下图是对应执行细节图:

    相关文章

      网友评论

          本文标题:【数据处理】基于留存预测日活

          本文链接:https://www.haomeiwen.com/subject/zmmsmltx.html