一、信用风险和评分卡的基本概念
信用风险:未履行合同的义务而造成的经济损失的风险。
评分卡:以分数的形式来衡量风险几率的一种手段,分数越高越安全。
二、数据预处理
1、数据展示
2、缺失值
填补缺失值的方法:
df = df.dropna() #去掉缺失值行
df = df.fillna(num) #补充固定的数
df = df.fillna(df.mean()) #补充均值
df = df.fillna(df.median()) #补充中位数
df = df.interpolate() #插值法
3、异常值
处理异常值的方法:
盖帽法
分箱法
三、探索性分析
单变量分析
多变量分析
网友评论