背景介绍
“购食汇”,一家O2O生鲜电商平台,成立于2015年,主营果蔬、肉蛋、水产、粮油等食品。为了让用户取货更为便利,平台在社区还设有智能自提柜,目前主要服务区域为四川绵阳市、四川成都市和安徽合肥市。对于生鲜电商来说,“挥一挥衣袖,就带走几个西柚”的用户自然比“轻轻地我来看看又走了”的用户更具价值,后者只是登录,而前者完成了登录到购买的转化,为企业带来了实实在在的现金收入,这部分客户可以认为是高价值客户,因此,了解高价值客户的特征对企业来说是及其重要的。在本案例中我们可以用购买转化率作为判断高价值用户的一条标准。定义:购买转化率=订单总数/登录次数。购买转化率越高,说明该客户越有可能是高价值用户。
那么,购买转化率主要受到哪些因素的影响呢?为探究这一问题,本案例数据选取了购食汇的3684条有效用户记录进行分析,包括用户成就(登录频率、经验值)、推荐行为(被推荐注册、推荐他人注册)、收货差异(附近有无自提柜)、注册差异(注册渠道)。
数据介绍
描述分析
用户购买转换率分布
从直方图我们可以看出,购买转化率取完对数后,分布近似于正态分布。
购买转化率与登录频率
本案例我们构造了衍生变量:登录频率=登录次数/存续时间,其中存续时间指用户最近一次登录时间与注册时间的间隔,单位为周。登录频率可以说明用户与平台的接触程度。从购买转化率与登录频率的散点图可以看出,二者有着明显的负相关关系,登录频率越高,反而购买转化率比较低,这对应到具体的业务情景中是什么呢?这说明部分用户的登录目的是进行浏览,就是随便逛逛,而非有明确的购买计划。
示例:分组箱线图对比
接下来再看下用户是否被推荐和注册渠道分别与转化率的关系。可以看到,被老用户推荐来注册的用户平均购买转化率比较低,可见他们不如自主找到购食汇进行注册的用户爱得深沉或者说主动注册的用户对产品的需求度更高;相比于Android渠道注册的用户,其他渠道的用户平均购买转化率更高。
此外,还有其他因素,如经验值与购买转化率的关系,在此就略过了,感兴趣的朋友可以自己动手试试。
回归分析
多元回归模型
为了进一步量化各因素对购买转化率的影响,就要利用到多元回归分析。回归后最终模型结果如下图,可以发现,除了注册渠道,其他变量均为显著变量,说明注册渠道对购买转化率没有影响;估计系数的正负表示相关关系的正负,比如登录频率估计系数为负说明随着登录频率提高,转化率下降,和前面描述性分析的结果是一致的。模型R square代表了模型整体的拟合情况,该模型R square为76.1%,说明拟合程度一般,算较好。
模型结果模型解读
模型解读以上的模型结果可以帮助你对号入座,更为直观地解读用户行为。比如,用户小明登录频率为2,经验值为215,自身不是被推荐注册的,但曾推荐他人进行注册,小明所在地附近有自提柜,并且他是通过Android渠道进行注册的,那么基于我们的模型结果,可以认为小明为高价值用户。
结论与建议
根据回归模型,我们得到了一份大体的业务改进指南,从而帮助我们更准确地理解用户行为,识别高价值用户,更有针对性地进行营销。 建议OK,本次案例到此就结束了,这是一个很简单的业务案例,但除了数据清洗这一步,基本上涉及了一个数据分析案例的每一步,而且是基于这是业务数据,当然数据是经过脱敏的,不过还是有一定借鉴意义。
参考:
1.狗熊会:基于用户购买转化率的高价值客户识别 | Excel案例
网友评论