预处理

作者: 一月芷 | 来源:发表于2019-02-20 12:25 被阅读4次

数据预处理的常用流程

  • 去除唯一属性
  • 处理缺失值
  • 属性编码
  • 数据标准化
  • 特征选择
  • 主成分分析

缺失值处理的三种方法

  1. 直接使用含有缺失值的特征

对于某些算法可以直接使用含有缺失值的特征比如决策树

2.删除含有缺失值的特征

3.缺失值的补全

补全方法:

  • 均值插补

样本属性可以度量使用平均值进行插补,样本属性不可度量使用有效值的众数进行插补

  • 用同类均值插补

首先将样本分类,然后以该类中样本的均值进行插补

  • 建模预测
  • 高维映射

将属性映射到高维空间

  • 多重插补

步骤:

  1. 通过变量之间的关系对缺失值进行预测,利用蒙特卡洛方法生成多个完整的数据集
  2. 在每个完整的数据集上面进行训练,得到训练后的模型及评价函数值
  3. 对来自各个完整的数据集的结果,根据评价函数进行选择,选择评价函数最大的模型其对应值就是最后插补值
  • 极大似然估计
  • 压缩感知以及矩阵补全

利用信号本身所具有的稀疏性,从部分信号中恢复原信号,氛围感知观测和重构恢复两个阶段

特征编码

特征二元化

将数值型属性转换为布尔值的属性

独热编码

采用N位状态寄存器对N个可能的取值进行编码

能够处理非数值型属性,在一定程度上扩充了特征,编码之后属性是稀疏的存在大量零元分量

特征选择

特征选择的方法大致分为三类

  • 过滤式
  • 包裹式
  • 嵌入式

相关文章

  • C语言预处理指令

    目录 一.预处理的工作方式... 3 1.1.预处理的功能... 3 1.2预处理的工作方式... 3 二.预处理...

  • C和指针——简介篇

    程序示例 预处理指令 以上5行都为预处理指令。因为它们是由预处理器解释的。预处理器读入源代码,根据预处理指令对其进...

  • 面向对象(三十三)-预处理指令

    什么是预处理指令预处理器指令指导编译器在实际编译开始之前对信息进行预处理。预处理指令注意点所有的预处理器指令都是以...

  • 第14章 预处理器

    英文原版:P315 诸如#define、#include等预处理指令都是由预处理指令是由预处理器来处理的。 预处理...

  • 1. C语言的编译步骤

    1. C语言的编译步骤 1.1 预处理 带#的语句就是预处理指令, 预处理指令在预处理的时候处理了 头文件展开: ...

  • C语言 枚举类型和预处理指令

    枚举的定义 预处理指令 所有的预处理指令都是以#开头 预处理指令分为三种 宏定义 条件编译 文件包含 预处理指令在...

  • 机器学习笔记

    精品笔记 ML AI 斯坦福机器学习笔记 GTD 数据预处理 数据预处理 预处理终版.

  • 静态库、动态库编译原理

    编译过程 预处理 -> 编译 -> 汇编 -> 链接 预处理 完成宏替换、文件引入,去除空行、注释等。 针对预处理...

  • 算法笔记(13)数据预处理及Python代码实现

    常用数据预处理工具:使用StandardScaler进行数据预处理、使用MinMaxScaler进行数据预处理、使...

  • tflite模型推理

    模型输入的预处理 这个预处理其实就是模型训练阶段的预处理流程,和它对齐就好,特征工程常见的一些预处理包括了: 图像...

网友评论

      本文标题:预处理

      本文链接:https://www.haomeiwen.com/subject/quhoyttx.html