1. 如何计算WoE
具体计算示例结果如下:
Weight of Evidence Calculation2. WoE的使用
将一个连续的独立变量转化成基于非独立变量分布的相似度的组, 例如 events 和 non-events 的数量
1. 对于连续的独立变量
- 对其进行分bin
- 对每个bin计算WoE
- 对WoE相同的bin进行合并,并将其用WoE值替代掉
2. 对于类别的独立变量
- 对每个类别计算WoE
- 对WoE相同的类别进行合并,并将其用WoE值替代掉
之所以合并具有类似WoE的bin/类别 , 是因为这样的bin/类别几乎拥有相同的 events/non-events比例, 即这样的bin/类别表现上是相同的
3. WoE的限制与应对
限制 | 应对 |
---|---|
每个bin/类别下至少有 的样本 | 一般取10~20个bin,bin越少越平滑,噪声也少 |
每个bin/类别 events/non-events都不能为0 | |
每个bin/类别都必须不同,相似的应该合并 | |
WoE应该是单调的,不管是增加bin,还是减少bin | |
对于缺失值需要另外分bin |
4. IV
主要用来选择对预测模型重要的特征
IV值与其对应解释:
Information Value | Variable Predictiveness |
---|---|
Not useful for prediction | |
Weak predictive Power | |
Medium predictive Power | |
Strong predictive Power | |
Suspicious Predictive Power |
网友评论