一、案例背景
Thera Bank是一家拥有不断增长客户群的银行。这银行中大多数客户的存款规模都是不一样的。由于贷款业务的客户数量很少,所以银行希望有效地将存款用户转化为贷款用户以此扩大贷款业务量的基础,以带来更多的贷款业务,并在此过程中,通过贷款利息赚取更多。
因此,该银行去年为存款用户但未办理个人贷款业务的客户开展了一项推广活动来促使其办理个人贷款业务,有部分客户通过此活动已经办理了相关服务。这时的零售营销部门希望制定更好的策略去定位营销,以最小的预算提高成功率。该部门希望识别出更有可能购买贷款的潜在客户,提高转化的成功率,降低营销的费用。
二、理解数据
1.导入数据
2.数据内容和数据理解
数据集共包含5000条记录,14个字段,对应字段含义如下:
ID - 客户
Age - 客户年龄
Experience - 客户工作经验
Income - 客户年收入(单位:千美元)
ZIPCode - 家庭地址邮政编码
Family - 客户的家庭规模
CCAvg - 每月信用卡消费额(单位:千美元)
Education - 教育水平 (1: 本科; 2: 研究生; 3: 高级)
Mortgage - 房屋抵押价值(如有)(单位:千美元)
Personal Loan - 此客户是否接受上一次活动中提供的个人贷款?(1:是 0:否)
Securities Account - 是否有证券账户?(1:是 0:否)
CD Account - 是否有存款证明(CD)帐户吗(1:是 0:否)
Online - 是否开通网上银行?(1:是 0:否)
CreditCard - 是否有信用卡?(1:是 0:否)
3.观察各字段基础信息,数据并无重复,缺失情况;对于一些数值型的字段则需要做一些数据类型的转化
4. 更改变量类型,方便后续做统计分析
5.观察数据的一个描述性信息
6.向上述表中可以看到,Experience的min值为负数,而工作经验是没有负数的,所以考虑将Experience(客户工作经验)的负值改为0
三、数据处理
整体思路:
一、去年银行举办的推广活动的效果如何?
二、什么类型的存款用户成为银行贷款业务的潜在客户可能性更大?
三、随着客户年收入的增长,贷款情况是如何变化?
四、随着客户年龄的增长,贷款情况如何变化?
对整体思路进行逐一分析:
一、去年银行举办的推广活动的效果如何?
1.活动推广结果基础分析
(Personal Loan - 此客户是否接受上一次活动中提供的个人贷款?)
可以看到此次参加活动的4520名客户中,有480名客户开通了个人贷款业务,由于该活动是针对未办理个人贷款业务的客户开展的,对比从以往数据来看,个人贷款业务增长了近10%,说明此次推广活动的效果还是不错的
2.探索其他变量与Personal Loan变量的关系,corr()函数找出相关关系大小,数值越大关系越强
用热力图展示所有关系之间的强弱,颜色越深,相关性越强
从图中可以看出:
1、和开通信贷强相关的变量有:收入,信用卡还款额及是否有该银行存单账户;
2、和开通信贷弱相关的变量有:受教育程度,房屋抵押贷款数,家庭人数;
3、邮编、是否是证券账户,是否开通网上银行及是否有信用卡,关系都不大;
4、年龄、工作经验虽然关系也不大,但它们属于连续的数值变量,所以需要分箱后再做观察,看看是否有某一段存在特殊值。
3.对强弱关系的做进一步的分析
3.1先剔除无关的变量,对其余相关变量进行分析
定性变量与开通贷款的关系(对定性变量中是否有该银行存单账户、受教育程度、家庭人数与是否开通贷款的关系进行探究)
3.1.1是否有该银行存单账户 (CD Account--是否有存款证明)
可以看出开通了银行存单账户的客户,其申请贷款的可能性是没有开通的6倍多,说明开通了银行账户的客户是一个主要的目标客户;找到方法让客户开通该银行存款账单也是一个提高申请贷款率的可能选项。
3.1.2 教育水平
Education - 教育水平 (1: 本科; 2: 研究生; 3: 高级)
可以看出,学历越高,申请贷款的客户也在上升,说明高学历更容易发展为潜在的贷款用户。
3.1.3 家庭人数
可以看出,单身人士与没有孩子的家庭的贷款率都比较低,有孩子的家庭用户相对而言更有意愿转化为贷款用户,特别是独生子女家庭
3.2 探究定量与开通贷款的关系
(对定量变量中的年龄、收入、信用卡还款额和房屋抵押贷款与是否开通贷款的关系进行探究)
3.2.1年龄
综合来看,各阶段的年龄的贷款意愿都相差不大,相对来说区间在(32.0, 39.0]的客户意愿较强
3.2.2对收入分层
当年收入超过82时,贷款意愿会有5倍以上的上升,超过98时,贷款意愿达到17%以上,超过170时,贷款意愿达到一半,相对收入越高,贷款的意愿越强烈
3.2.3房屋抵押值和抵押值分层
大部分没有申请贷款的,信用卡消费额的均值在1.7K美元左右,而申请贷款的客户信用款消费额均值达到3.9K美元,是其2倍有多。
3.2.4对每月消费额进行分层
大概在每月消费额为2.8千美元时,申请贷款率会增大将近4倍,超过6千美元时,申请申请贷款率会有所回落到31%左右,但这个贷款意愿相对还是很强烈的,可对每月消费额在2.8千美元以上的客户加大力度去营销
四、结论
通过这次活动,个人贷款业务增长了近10%,说明此次推广活动的效果还是不错的
对于开通了银行账户的用户需要加强营销力度,他们的贷款意愿相对于没有开通银行账户更强
教育水平越高的客户越容易接受贷款
家庭人口较多的家庭贷款意愿较强,尤其是独生子女的家庭
年龄区间在30-40岁的客户相对贷款意愿更强
相对收入越高,贷款的意愿越强烈, 当年收入超过82时,贷款意愿会有5倍以上的上升,超过98时,贷款意愿达到17%以上,超过170时,贷款意愿达到一半
当房屋抵押值大于190.5千美元时,贷款申请的意愿有明显的提升
每月消费额在2.8千美元以上的客户,贷款申请的意愿有明显的提升
网友评论