在通过传统模型的预测方法发现对业务数据预测结果并不理想之后,找到指标之间的关联,对有明显线性趋势的‘衍生指标’进行预测,这样能提高对指标预测的精度和效率。所以指标的熟悉度对预测的前期准备很重要。指标的熟悉度!指标的熟悉度!指标的熟悉度!
【预测方法与问题】
最初使用指数平滑预测,指数平滑预测不舍弃过去的数据,但是仅给予逐渐减弱的影响程度,即随着数据的时间拉长,赋予逐渐收敛为零的权数,但是该预测方法只能赋予远期较小的比重,近期较大的比重,所以适用于进行短期预测;
公式:
指数平滑模型· St--时间t的平滑值;
· yt--时间t的实际值;
· St − 1--时间t-1的平滑值;
· a--平滑常数,其取值范围为[0,1];
这是一次指数平滑,一次指数并不能反映出时间序列的趋势和季节性,因此我们使用holt-winters加法模型,即累加三次指数平滑模型,三次指数平滑在二次指数平滑的基础上保留了季节性的信息,使得其可以预测带有季节性的时间序列。
举例DLU用户用三次指数平滑预测结果(结果做过处理)如下:
三次平滑预测结果单看指标预测并没有什么问题,因为整体趋势是稳定上涨,而预测值也是稳定增长的。本来对这个预测结果充满信心,但致命问题立马浮出水面:预测出来的结果不符合行业市场的趋势!
这样的结果主要有以下4个原因导致:
1、 没有参考行业权威数据并考虑行业市场饱和度,这简直是最致命的问题,根据模型预测单个指标,出现了过分预测的结果;如果没有权威行业数据的参考,或者没有考虑到行业市场的饱和度,这个纯预测模型出来的结果肯定是不可取的;
2、 单纯依赖指数模型会过分预测,这是由于指数模型对近期数据赋予的权重很强,所以每个月更新预测的数据都会有很大差异;会遇到很多季节性,周期性的问题,例如,春季/国庆/开学
3、 没考虑指标间关联性,预测的指标一多就乱了分寸,找到每个指标之间的关联性对预测的逻辑性和精度是非常有帮助的,这使得预测结果有理可据;
4、 没有结合专家经验,对业务的了解,结合产品运营以及产品的生命周期去衡量指标的预测方向。
【预测方法改进&数据佐证】
根据以上总结的四点问题,对预测方法改进,尝试过结合环比、同比进一步对指标预测,但是结果依然是过分预测;根据平时业务分析的经验,发现一些‘中间指标’,比如一些指标渗透率,占有率,ARPU值等有非常明显的线性趋势,那么就决定尝试这从指标关联性之间入手,方法如下图:
指标关联性在预测之前罗列所有指标后发现DLU(业务使用用户)与其他活跃指标联系性最高,因此决定将DLU作为其他指标预测的媒介,那么DLU就是这次预测的核心指标,要保证后续的指标预测精度和准确度,就要验证DLU的预测数据有理可据,那么如何验证DLU数据预测准确性?
参考行业的权威数据。互联网行业数据报告会按月度、季度公布,里面的数据非常具有参考的价值,所以根据行业的总体数据,结合预测出来的DLU用简单的方法就能判定DLU的预测是否合理,是否符合行业数据的发展情况。
当然,行业数据未来趋势到底如何,我们不能加以笃定,每个业务产品都有自己的生命周期,这个佐证只是验证我们对DLU预测的方向是否正确,不能完全说明预测就是100%准确。
验证DLU数据没问题之后,就可以根据指标之间关联的方法预测出其他指标。
1、 通过DLU的年同比的预测(因为年同比呈稳定趋势),进而预测出DLU;
2、 其他活跃指标,如DAU(活跃用户),CNT(次数)等,通过渗透率、户均次数等这些有明显稳定线性趋势的指标作为‘衍生指标’进行预测,这次分析过程中用到对预测起到有效帮助的‘衍生指标’:
i渗透率:DAU/MAU,DAU/DLU等(这些指标可以观察出核心用户比例变化)
ii 户均次数:CNT/DAU,CNT/DLU等(观察用户活跃变化)
iii平台占比大盘:IOS/TOTAL, ANDROID/TOTAL 等(观察平台或子指标对大盘影响的逐渐变化)
iv 年同比:适用于任何指标 (对指标以往的表现,尤其季节性因素有参考判断性)
3、 用‘衍生指标’结合DLU的预测结果,得出最终的活跃指标的预测值。
寻找指标之间显而易见的联系,这样能一定地消除季节性因素,并有明显线性的趋势,降低了预测的难度,增加了精度。
【预测总结】
模型总是这么‘完美’,脱离实际,毕竟普遍大众的心里无法掌握;
自我束缚,忽略了同业竞品的表现,毕竟盘子就这么大,咋可能飞出宇宙;
指标分离让预测变得更难,一定要找到关联性,预测会迎刃而解;
专家经验以及行业权威数据能引导预测的方向,一味地预测往往会脱离整个产品风向的轨道。
相信前辈们还有更多专业的好的预测方法,欢迎交流。
网友评论