写这篇文章的主要目的是,想说明数据挖掘在运营、营销中的巨大作用。
最近在和一家做在线转账产品的公司合作,看到该公司对数据的运营相对来说还是比较表面的,拿到数据拉一下表格,做一下横纵对比就完事了。这种做法无论是在电商公司、运营企业,还是在传统企业其实也是非常普遍的,但是也是非常容易产生误差,甚至是错误的指导作用。
特别是偶然间看到一个专注做营运培训和指导的公众号上,发表过一份关于微信公众号数据分析的文章,里面采用的也是一样将一堆数据直接作为分析样本来做横纵对比,这时候我就更加确定,如果想要做好数据分析,一定的统计学和数学知识是必须的,只有具备了完善的知识,才能真正知道如何避免数据陷阱,别忘了,数据在告诉你真相的时候,也是会撒谎的。
Ok,今天这个案例主要是来讲一讲聚类分析的巨大作用,这是一个聚类分析让付费转化率提升8倍的案例。
一、案例背景:
A公司推出了一款在线转账的产品,用户通过该产品在线转账时交易费用比普通的网银要便宜。在经过一段时间的测试性运营之后,企业积累了一定数量的、使用该产品的付费用户,现在产品运营团队需要基于该批实际使用的付费用户数据,来分析找出有价值的特定群体,进而通过精细化运营提升付费用户的数量。
但是由于该产品上线时间很短,业务方面并不清楚付费用户的特点,另外,前期运营阶段并没有做专门的定向推广,所以常规的分类模型并不适合当前的业务场景。
因此,在这种情况下,对客户群体做聚类分析是十分必要的,它能够帮你锁定特征明显的目标群体,让你能够精细化运营促进付费用户的有效增长。
二、基本的数据摸底:
业务方根据业务逻辑和经验,整理出了15个能够反应用户特征的字段,包日均活跃量、总体流量、pv、在线时间等维度。
为了保证聚类效果的真实可靠,这里首先先对部分异常值做删除处理。同时,做聚类分析的时候,参与聚类的变量不能过多,因此,根据业务的需求以及重要性的测量,这里就选择了3个变量参与聚类,其余的变量可以在聚类完成后做群体描述的时候添加进来,在进行群体特征的分析。
三、聚类后的初步分析:
在做了多次的聚类探索之后,可以得到下列表格数据:
可以看到,上述的样本被分为8个群体,整体的R-Square为0.75534,说明群体间的差异性比较明显。但是考虑到部分群体内的样本数量太少,在实际应用中可以忽略不计,所以上述聚类结论中比较有代表性的群体为:
第7组,聚类样本中该组共有192个用户,占样本总量的30%,这组的RMSSTD为0.436632,loginfreq为148.92,tp index均值为11.34,均值为8133.23;
第3组,共有51个用户,占样本总量的8%,该组的RMSSTD为0.495173,loginfreq均值为138.17,tp index均值为8028.51。这组与第七组中的各项指标非常类似,是可以作为优质群体合并的。
再来看第5组,共有304个样本,占样本总量的47%,RMSSTD为0.258068,loginfreq均值为21.32,tp index均值为2.56,pv均值为1808.43.
上述3组共占样本总量的85%,具有很强的代表性。
四、将分析结果与业务结合深度分析
在上述分析的基础上,又增加了其他3组变量来做特征描述,包括俱乐部指数、消耗记录、会员身份,就得到了5类典型的付费群体。通过分析,选择其中的2个群体特征指标做目标用户的圈定,并进行具体的精细化运营:
群体A:占样本数量的15%,主要特征为:全部是企业俱乐部用户,全部有在线交易历史,俱乐部年限小于4年,登陆次数大于110次,pv量大于10000,绝大部分有消耗记录;
群体B:占样本总量的10%,主要特征是:全部是个人俱乐部用户,全部有在线交易历史,俱乐部年限小于2年,登陆次数大于100次,并且俱乐部指数小于80.。
五、落地运营成果:
根据上述2个特征,就可以从全部样本数据中提出去满足上述特征的20000个潜在用户,并进行了为期1周的定向在线运营,通过3轮营销推广活的(不同渠道、不同文案),产生了以下的运营成果:
在为期一周的定向运营活动里,这20000名目标受众总1358名用户转化为付费用户,付费转化率为6.79%,与前期无特定的即时通讯工具运营的付费转化率不足1%相比,可以看到这次运营获得的效率得到明显的提升。
Ps:准备了一个聚类分析银行理财产品的案例,这个案例通过聚类深度分析各个群体的特征,实行精准化营销,最终3个月获得1.4亿销售额,平均客单价为600元。
网友评论