美文网首页
WoE 和 IV

WoE 和 IV

作者: 天之見證 | 来源:发表于2018-12-29 00:19 被阅读0次

1. 如何计算WoE

WoE=\ln \frac{\text{% of non-events}}{\text{% of events}}

具体计算示例结果如下:

Weight of Evidence Calculation

2. WoE的使用

将一个连续的独立变量转化成基于非独立变量分布的相似度的组, 例如 events 和 non-events 的数量

1. 对于连续的独立变量

  1. 对其进行分bin
  2. 对每个bin计算WoE
  3. 对WoE相同的bin进行合并,并将其用WoE值替代掉

2. 对于类别的独立变量

  1. 对每个类别计算WoE
  2. 对WoE相同的类别进行合并,并将其用WoE值替代掉

之所以合并具有类似WoE的bin/类别 , 是因为这样的bin/类别几乎拥有相同的 events/non-events比例, 即这样的bin/类别表现上是相同的

3. WoE的限制与应对

限制 应对
每个bin/类别下至少有 5\% 的样本 一般取10~20个bin,bin越少越平滑,噪声也少
每个bin/类别 events/non-events都不能为0 \frac{\text{% of non-events}+0.5}{\text{% of events}+0.5}
每个bin/类别都必须不同,相似的应该合并
WoE应该是单调的,不管是增加bin,还是减少bin
对于缺失值需要另外分bin

4. IV

IV=\sum(\text{% of events - % of non-events}) * WoE

主要用来选择对预测模型重要的特征

IV值与其对应解释:

Information Value Variable Predictiveness
\lt 0.02 Not useful for prediction
[0.02, 0.1) Weak predictive Power
[0.1, 0.3) Medium predictive Power
[0.3, 0.5) Strong predictive Power
\ge 0.5 Suspicious Predictive Power

相关文章

  • 谈谈 WOE和IV

    谈谈 WOE和IV[WOE] weight of evidence ,即证据权重;[IV] information...

  • WoE 和 IV

    1. 如何计算WoE 具体计算示例结果如下: 2. WoE的使用 将一个连续的独立变量转化成基于非独立变量分布的相...

  • WOE IV KS指标

    WOE和IV使用来衡量变量的预测能力,值越大,表示此变量的预测能力越强。 WOE=ln(累计正样本占比/累计坏样本...

  • WOE与IV值

    原文链接:WOE与IV值 微信公众号:机器学习养成记 搜索添加微信公众号:chenchenwings 计算WOE...

  • (一)python-申请评分卡模型

    简介 本文通过使用LendingClub的数据,采用卡方分箱(ChiMerge)、WOE编码、计算IV值、单变量和...

  • 变量筛选之WOE和IV

    不生产知识,只做知识的搬运组装工~ WOE (Weight Of Evidence) WOE是一种对类别特征进行编...

  • 初识IV值、WOE

    IV值的简单说明 IV,即information value,中文含义为信息价值,或者说信息量 当现实中,我们进行...

  • woe与iv (python)

    https://blog.csdn.net/kevin7658/article/details/50780391 ...

  • WOE、IV、PSI介绍

    WOE 1.定义: WOE的全称是“Weight of Evidence”,即证据权重。WOE是对原始自变量的一种...

  • 风控数据分析学习笔记(三)Python实现woe自动分箱转化

    (一)(https://www.jianshu.com/p/2759e090bd53)中提到了woe、iv等评分模...

网友评论

      本文标题:WoE 和 IV

      本文链接:https://www.haomeiwen.com/subject/qkiylqtx.html