反欺诈实践中分为3步:
- 明确模型目标
- 挖掘数据价值
- 及线上预测。
建立反欺诈
我们主要是做如下步骤
![](https://img.haomeiwen.com/i11346836/152bff1cf57339df.png)
欺诈定义
5种方法来定义欺诈
- 逾期超过T天。这是最直观也是最简单的定义,这个定义中的T即可以通过滚动率等量化的手段来预估,也可以根据业务经验来确定,比如在互联网金融行业通常将T定为180天。
- 首期不还款。首期不还款指的是从第一期开始,客户就没有还过款。在互联网金融领域,通常会在在逾期超过T天的基础上加上首期不还款这个条件来进一步筛选欺诈。
- 首期失联。当客户发生首期逾期后,互联网金融企业通常会通过电话联系客户。当联系失败或者客户明确表示不还款时,则定义客户为首期失联。
- 回访失踪。在客户发生逾期后,有的互联网公司会通过客户提供的地址实地回访客户,如果找不到客户,则定义客户为回访失踪。
- 权威部门确认。客户是否欺诈还可以通过权威部门来确认,这也是最严格的有关欺诈的定义。
上述的方法其实是分为三类:
- 还款数据相关,1,2条,逾期超过T天+首期不还款
- 人工干预,3,4,首期失联,回访失踪
- 第三方判定,5
由于搭建模型具有一定的滞后性,人工干预和外部干预的方法往往在建模时已经失效了(除非,数据里有明确的人工干预结果记录),因此通常会使用与还款数据相关的方法来定义欺诈,也就是说方法1+方法2。具体的如下图所示:
![](https://img.haomeiwen.com/i11346836/aa0a0ed6dda7b08c.jpg)
当然,这样的定义会有一定的误差。
一方面它会将一些信用违约误判为欺诈
另一方面,它也会“漏掉”一些欺诈,比如有的欺诈者为了获取更大的额度,会“假装”先期还款几次。但整体来说,这两种情况所占的比例都不大,可以认为这样的定义是合理的。
网友评论