题图来自Unsplash,基于CC0协议作者通过利用友盟平台获取的用户行为特征数据,通过二次营销建模分析,找出与产品办理相关的重要特征进行业务优化。
一、案例背景
国内某头部消费金融公司为我司客户。我们利用友盟平台数据,通过用户行为特征的分析,利用我司独有的二次营销建模技术,帮助其筛选用户,提高用户的办理效率,节省单个用户办理成本。
二、数据规划
目标:利用友盟平台获取的用户行为特征数据,通过二次营销建模分析,找出与产品办理相关的重要特征进行业务优化。数据需求如下:
1、指标:手机设备情况
备注:数据设定条件:所有行为数据都发生在办理产品之前的一段时间内。2、数据维度
三、数据分析
(一)总体分析
对上述用户行为特征与产品办理目标进行建模分析,采用的机器学习算法为lightgbm模型。测试集AUC(Area under the ROC curve)为0.6575。(虽0.6575不算是非常优秀的区分能力,但是在二次营销领域足够具有说服力。)
由此说明这批特征和产品办理目标存在相关关系,可以进一步分析模型的重要特征。
备注:因为该案例为真实案例,为客户保密角度,部分数字有做修改,但并为进行脱敏。以下表格数字同同上。模型测试集数量为4,000,其中办理产品数量为964,占比24.10%,在不同的阈值,针对大于该阈值的人进行精准营销,得出以上结果。随着选择阈值的提升,办理的覆盖率会降低,但是办理预测的精确率会随着提升,同时降低单位成本幅度。举例说明,当阈值为0.55,精准投放人群为640,覆盖率为16%,真实办理数量为310,命中率可达48.4。同现有命中率对比可知,命中率提高了101%,命中办理单位成本幅度降低50.3%。当阈值为0.85的时,虽然命中率最高可达87.5%,命中率提高263.1%,命中给班里单位成本幅度降低了72.5%,但是精准投放人群仅为16,基数太小不具有足够的说服力,需要慎重考虑。
假设每单位成本为1,在没有模型下每命中办理单位成本为4,000/ 964 = 4.15
具体选定哪个阈值进行营销,需要根据实际单位办理成本和单位利润进行计算,方可得出利润最大阈值区间进行精准营销。
(二)重要特征分析
从建模的特征里选出重要的特征在全部10000条数据上进行单变量分析。
金融理财类APP活跃度是移动设备在金融理财类APP上的相关统计信息,活跃度高的人群办理比例比低活跃度的人群高,活跃时间越临近,其办理比例越高。
备注:空值为缺失数据,以下特征同是。
信贷类APP活跃度是移动设备在信贷类APP上的相关统计信息,活跃度高的人群办理比例比低活跃度的人群高,活跃时间越临近,其办理比例越高。
旅行类APP活跃度是移动设备在旅行类APP上的相关统计信息,活跃度低的人群办理比例比高活跃度的人群高。
房产类APP活跃度是移动设备在买房,租房,家装类APP上的相关统计信息,活跃度高的人群办理比例比低活跃度的人群高。
金融类APP行为强度是用户使用的金融类APP的使用时长、使用时段、频度等综合
计算得出的强度指数。行为强度指数高的人群办理比例比低指数的人群高,其中高亮的两个特征效果更加突出。
1、表中显示不同的活跃度对应着不同的办理比例,活跃度高的人群办理比例比低活跃度的人群高,且区分度高,倍数范围在1.6倍-2倍。
2、表中显示活跃时间越临近,其办理比例越高。
3、从时间、场景偏好、行为习惯等维度分析其消费偏好导向,为营销定位提供数据基础。
手机设备在180天内无行为记录的人群办理比例比有行为记录的人群低。
四、成果展示
模型分类阈值 命中率 命中率提升 降低命中办理单位成本幅度*
在不同阈值的情况下,进行精准营销,随着选择阈值的提升,办理预测的精确率会随着提升,且同时降低单位成本幅度,从而达成精准营销的同时降低整体运营成本。
综上所述,金融理财类和信贷类APP活跃度和金融APP行为强度是与办理情况相关性较强的特征,其中活跃度或行为强度指数高的人群办理比例较高,是推荐的用户人群。模型的预测结果可以用于筛选用户,提高用户的办理率,模型阈值选择推荐0.55,用户办理率预期可以提高101%,单位办理用户成本降低50.3%。
作者:谷慧
本文为「人人都是产品经理」社区和友盟+联合举办的“2019「友盟杯」数据分析大赛”中获奖作品,未经作者及平台许可,禁止转载
本文部分数据有脱敏处理,非全部真实数据
有关产品测评大赛合作事宜,请联系邮箱:denis@woshipm.com
网友评论