美文网首页
机器学习—特征工程

机器学习—特征工程

作者: 财务自由_lang | 来源:发表于2018-08-29 14:10 被阅读0次

详细pdf:
链接:https://pan.baidu.com/s/1pUWhb_y7kK7_fU0Gjqfe0Q 密码:602l
sklearn中的特征工程:https://www.cnblogs.com/jasonfreak/p/5619260.html

特征工程实则是数据深度清洗过程

1.数据清洗

a. 数据格式化(日期,数值格式化)
b. 脏数据清洗(不合理数据)
c. 缺失值处理方案
方案一 : 如果缺失值的样本占总数比例行高,可直接舍弃该字段,反倒成为噪声
方案二 : 如果缺失值的样本占总数比例适中,且该字段是离散型值,将缺失值作为新的一类
方案三:如果缺失值的样本占总数比例适中,且该字段是连续型数值,将数值离散化处理,将缺失值作为新的一类
方案四: 如果缺失值得样本占总数比例较少,可根据已有的值,拟合一定的数据补充上

2.数据采样

. 采样方式
1.随机采样
2.分层采样
. 正负样本不平衡处理办法
1.上采样(量大)
2.下采样(量小)

3.特征处理

1.数值型

image.png
  1. 类别型
image.png
  1. 时间型
image.png
  1. 文本型
image.png
image.png
  1. 统计型
image.png
  1. 组合类型
image.png

4.特征选择

过滤型
包裹型
嵌入型

相关文章

  • 机器学习—特征工程

    详细pdf:链接:https://pan.baidu.com/s/1pUWhb_y7kK7_fU0Gjqfe0Q ...

  • 机器学习-特征工程

    outline 概念 预处理 特征选择 降维 概念 数据集由数据对象组成,一个数据对象代表一个实体属性(attri...

  • 机器学习 - 特征工程

    大部分上传的截图都挂了,大家见谅吧,也不影响学习的 什么是特征工程 书接上文,前文我们看到鸢尾花数据集张什么样子:...

  • 机器学习 - 特征工程

    数据处理 缺失值处理行数据缺失过多,用户区分度就会降低,列数据缺失过多会导致建模存在偏差fillna:填充缺失值;...

  • 机器学习之特征工程 - 整理

    以下内容整理自机器学习之特征工程 特征工程: 定义:利用数据领域的相关知识来创建能够使机器学习算法达到最佳性能的特...

  • 特征工程

    在机器学习应用中,特征工程扮演着重要的角色,可以说特征工程是机器学习应用的基础。在机器学习界流传着这样一句话:“数...

  • sklearn库-特征工程

    sklearn作为python机器学习的一个常用库,可以用来做特征工程,算法的调用,模型的评估 特征工程 特征工程...

  • 美团机器学习实践第二章-特征工程总结

    思维导图如下: 在机器学习应用中,特征工程扮演重要的角色,可以说特征工程时机器学习应用的基础。我们都知道,数据和特...

  • 面向机器学习的特征工程 一、引言

    来源:ApacheCN《面向机器学习的特征工程》翻译项目 译者:@ZhipengYe 校对:(虚位以待) 机器学习...

  • 【特征工程】特征工程技术与方法

    引言 在之前学习机器学习技术中,很少关注特征工程(Feature Engineering),然而,单纯学习机器学习...

网友评论

      本文标题:机器学习—特征工程

      本文链接:https://www.haomeiwen.com/subject/kgohwftx.html