美文网首页
风控预测-1 赛题理解梳理

风控预测-1 赛题理解梳理

作者: 徘徊于左右 | 来源:发表于2020-09-15 23:28 被阅读0次

训练集traindata:80000045(去除重复的n2列),y_train:8000001,本地testA:20000*45 (去除重复的n2列) ,线上testB:200000

根据给出的训练集训练模型,来预测testA的isDefault的值,此问题是个常见的二分类问题,首先进行数据EDA,如大致分布,特征类型(连续型/离散型/类别型),缺失值数量和填补方式(中位数/均值/向后填充/向前填充/kNN填补/预测填补。。),离散数据处理编码(labelencoder/One-Hot编码。。);结合业务理解,能否得出衍生指标。评估模型好坏:评价指标(TPR/FPR/F1-score,KS,AUC。。)。

常用二分类分类器模型,如logistic/SVM,树模型Dtree/rf/bagging/adaboost/GBDT/XGBoost等,

调参:交叉验证,如常用的多次5折/10折,网格搜索/随机搜索

模型融合:简单的融合就是对各种模型训练结果投票

相关文章

  • 风控预测-1 赛题理解梳理

    训练集traindata:80000045(去除重复的n2列),y_train:8000001,本地testA:2...

  • 阿里云天池——金融风控-贷款违约预测(一)

    赛题理解 赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通...

  • DataWhale金融风控打卡记录

    Task01 1.学习目标 1.1理解赛题数据和目标,清楚评分体系。 1.1.1赛题介绍 该赛题以金融风控中的个人...

  • 2018-08-30

    金融风控练习赛一 赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判...

  • DataWhale金融风控入门 Task 1 赛题理解

    Task 1 赛题理解 比赛地址:https://tianchi.aliyun.com/competition/e...

  • NLP之新闻文本分类-Task1

    Task1 赛题理解 本章将会对新闻文本分类进行赛题讲解,对赛题数据进行说明,并给出解题思路。 赛题理解 赛题名称...

  • 金融风控赛一

    赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款...

  • cv街景门牌字符的赛题理解

    Datawhale 零基础入门CV赛事-Task1 赛题理解 1 赛题理解 赛题名称:零基础入门CV之街道字符识别...

  • 贷款违约预测-Task1 赛题理解

    Task1 赛题理解 Tip:本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第四场 —— 零基础...

  • 新闻推荐01——赛题理解

    1. 题目理解 1.1 题目概况 新闻推荐场景下的用户行为预测 赛题以新闻APP中的新闻推荐为背景,要求选手根据用...

网友评论

      本文标题:风控预测-1 赛题理解梳理

      本文链接:https://www.haomeiwen.com/subject/ltwqyktx.html