目的
信息时代使得企业的营销焦点从产品中心转变为用户中心,维系“客户关系”成为企业核心问题。而这个核心问题最大的痛点:用户分类【20/80法则: 往往20%的核心用户承担着整个贡献额的80%;另外80%的普通用户承担额外的20%的贡献】,通过用户分类能够完成无价值用户、高价值客户的区分。那么就可以针对不同价值的用户制定优化的个性化方案,进而采用不同营销策略,将有限的营销资源集中于高价值用户,实现企业利润最大化。
【注:针对用户价值分类 各有各的实际玩法】
实施
分析
在进行用户分类我们的首要目标是用户价值识别,即通过实际的用户数据识别不同价值的用户。识别用户价值最广泛的模型:RFM模型。
RFM模型通常涉及三个指标:最近消费时间间隔(Recency)、消费频率(Frequency)、消费金额(Monetay)
- 最近消费时间间隔(Recency):用户最近一次消费距观测窗口结束的时间
- 消费频率(Frequency):用户在观测窗口内购买商品的次数
- 消费金额(Monetay): 表示在一段时间内,用户购买金额的总和; 不过呢,可能有产品本身性质购买内容、商品价格等问题,会导致消费金额不同。所以尽量选择用户在一定时间内累计购买数量和在一定时间内购买内容对应的平均系数C来代替消费金额。
另外也需要考虑用户的注册时间L在一定程度会影响用户价值。
综上所述,我们提取了5个指标作为用户价值指标.
模型 | L(注册时间) | R (消费时间间隔) | F (消费频率) | M(购买商品数量) | C(购买商品对应的折扣系数的平均值) |
---|---|---|---|---|---|
LRFMC模型 | 用户注册时间距观测时间结束的月份 | 用户最近一次消费距观测时间的月份 | 购买商品频率 | 购买商品数量 | 购买商品对应的折扣系数的平均值 |
那么接下来我们通过使用K-Means聚类来完成最有价值用户的识别。
数据预处理
关于本节具体见数据预处理
(1)、关于5个指标数据预处理
由于原始数据源是不存在这5个指标的,需要通过原始数据提取完成的。
L = 观测窗口的结束时间 - 注册时间(单位:月)
R = 最后一次消费时间至观测窗口结束的时长(单位:月)
F = 观测窗口内消费次数
M = 观测窗口购买商品的总数
C = 用户在观测窗口内购买商品所对应的折扣系数的平均值
由于5个指标取值范围差异比较大,需要对数据进行标准化处理来消除数据量级数据带来的影响
<code>
数据读取
datafile <- read.csv('./data/zscoredata.csv',he=T)
数据标准化
zscoredfile <- scale(datafile)
重命名列名
colnames(zscoredfile) <- c("ZL","ZR","ZF","ZM","ZC")
数据写入
write.csv(zscoredfile,'./tmp/zscoreddata.csv')
</code>
(2)、模型构建
用户价值模型需要考虑两方面:
1、五个指标的数据来完成用户的聚类分群
2、结合业务对每个用户群进行特征分析,分析其用户价值,进而对每个用户群进行排名
- 用户聚类
<code>
数据读取(读取第一步标准化后的数据)
inputfile <- read.csv('./tmp/zscoreddata.csv',he=T)
聚类分析
result <- kmeans(inputfile,5)
结果输出
type <- resultcenter
</code>
结果如下图
-
用户价值分析
接下来针对聚类解决进行特征分析:
聚类结果
聚类类型 | 聚类个数 | L(注册时间) | R (消费间隔) | F (消费频率) | M(商品数量) | C(平均折扣率) |
---|---|---|---|---|---|---|
用户群1 | 6205 | 0.17852503 | -0.0110559645 | 0.012874186 | 0.008531520 | -0.010744951 |
用户群2 | 31024 | 0.01318265 | 0.0009489423 | -0.014321036 | -0.008730402 | -0.009925073 |
用户群3 | 18615 | -0.15138286 | 0.0281135828 | -0.011842433 | -0.010523091 | 0.011610353 |
用户群4 | 43432 | 0.09623873 | -0.0247513498 | 0.021888722 | 0.017190567 | 0.019278291 |
用户群5 | 55840 | -0.13658118 | 0.0067442291 | -0.008599405 | -0.006468417 | -0.010217024 |
用户群特征
群类型 | L(注册时间) | R (消费间隔) | F (消费频率) | M(商品数量) | C(平均折扣率) |
---|---|---|---|---|---|
用户群1 | 1 | 1 | 1 | ||
用户群2 | 1 | 1 | |||
用户群3 | 1 | 1 | |||
用户群4 | 1 | 1 | 1 | 1 | |
用户群5 | 1 |
由上得出:用户类别划分
- 重要保持用户
这类用户平均折扣率C较高(一般购买商品等级较高),最近消费间隔小(R),购买商品数据量大(M)或消费频率高(F),这类用户数据高价值用户也是最为理想用户类型。往往贡献值最大,所占比例却较小。 - 重要发展用户
这类用户平均折扣率C较高,最近消费间隔小(R),但购买商品数据量小(M)或消费频率小(F) - 重要挽留用户
这类用户平均折扣率C较高,购买商品数据量高(M)或消费频率高(F),但最近消费间隔高(R) - 一般用户
- 低价值用户
最后两类用户平均折扣率C较低,购买商品数据量低(M)或消费频率低(F),最近消费间隔高(R),一般会在产品搞促销或活动类才会消费
另外本模型采用历史数据进行建模,随着时间的变化,分析对应的数据观测窗口也在变换,需要考虑新增用户详情信息及业务实际情况,能够保证一个月甚至合理业务周期运行一次模型。进而对新增用户通过聚类中心进行判断,并对新增用户进行特征分析。需要注意如下
1、实际情况与判断结果的差异, 需要业务方着重关注,查看变化的原因及确认模型的稳定性
2、模型进行重新训练的时间没有统一标准,多半是根据经验来决定的(常见:每半年训练一次模型较为合适)
(3)、模型应用
在完成对各个用户群体的特征分析后,需要进行相应的营销手段和策略,来完成价值用户群管理,提供产品价值。类似如下:
- 会员的升级与保级
- 提高用户消费与福利 优惠的回馈
- 交叉营销
- 定向定制化优惠
后记
在完成用户价值分析后,同样也需要来完成用户流失分析。具体过程可以参考价值分析过程。
另外相关内容的定义:
比如老用户的定义(类似购买次数大于6次),已流失用户(类似前后一个月购买次数比例 < 50% ),准流失用户(类似前后一个月购买次数比例 [ 50%,90%)),未流失用户(类似前后一个月购买次数比例 >=90%)。等等 需要结合实际业务来完成。
网友评论