美文网首页
拓端数据(tecdat):决策树算法建立电信客户流失模型

拓端数据(tecdat):决策树算法建立电信客户流失模型

作者: 拓端tecdat | 来源:发表于2022-02-13 20:40 被阅读0次

    原文:http://tecdat.cn/dt模型打好用户流失预防针-电信客户流失浅析/

    Consumers will subscribe to multiple telecom services (televisions, paid programs, games, etc.) today. However, the degree of differentiation provided by telecom providers is not high, and customer loyalty becomes a problem.

    As a result, it is becoming increasingly important for telecom companies to proactively identify lax-minded customers and take precautions to keep these customers.

    Based on the above background, tecdat researchers analyzed the loss of data for 16 years to date and established a prediction model to identify customer groups with high probability of loss and to identify which user characteristics ("X") were lost to users (" Y ") will have a significant impact.

    数据概览

    使用收视服务的用户最多,订阅付费节目其次,订阅游戏业务用户数量最少。

    订阅收视业务的用户增长最快,其次是订阅游戏业务的用户,而订阅付费节目的用户增长缓慢,同时流失严重。

    相比较16年,用户净增长37%,然而17年上半年的流失比例相比较去年增加8%。

    ▍不同维度的流失率比较

    我们比较了不同营业厅和是否发放数字机顶盒的用户流失情况。

    可以看到相比较发放了数字机顶盒的用户来说,没有发放机顶盒的用户更容易流失。

    从不同营业厅的流失情况来看,沙河站和南口站的流失率最高,昌平站和小汤山站的流失率较低。

    ▍用户流失预测模型

    然后,我们使用DT算法分析电信客户特征的特点,并获得流失客户的基本特征,分析客户的行为特征,采取有针对性的措施,改善客户关系,避免 客户损失或留住客户,达到补救的效果。

    ▍技术

    DT(decision tree)用于构建、验证和测试数据集的模型。

    在Spark / MLLib / Scikit-Learn / HDFS中重构实现处理较大的数据集。

    ▍结果

    模型预测客户流失的精度精度达到93.2%。

    影响客户流失或对“Y”产生重大影响的关键变量有:

    营业厅的位置

    是否发放数字机顶盒

    在分析客户的行为特征之后,我们采取有针对性的措施,改善客户关系,避免 客户损失或留住客户,达到补救的效果。

    相关文章

      网友评论

          本文标题:拓端数据(tecdat):决策树算法建立电信客户流失模型

          本文链接:https://www.haomeiwen.com/subject/xzlbbhtx.html