美文网首页
数据分析流程

数据分析流程

作者: 姚宝淇 | 来源:发表于2020-04-14 08:04 被阅读0次

看数据集

分布情况、分散趋势(四分位数、方差)、中心趋势(均值、中位数)、正负样本比例

数据预处理

缺失值:删掉、邻近填充、平均值/中位数填充;

异常值:看箱型图判断,若是则删掉

平衡数据(必要时):过采样SMOTE

log变化(必要时):当模型需要正态分布样本而样本不符合时

选择模型和评估指标

建模调参

相关文章

网友评论

      本文标题:数据分析流程

      本文链接:https://www.haomeiwen.com/subject/aobamhtx.html