归一化

作者: 专注吃喝五十年 | 来源:发表于2018-06-24 19:40 被阅读0次

    归一化其实就是把数据scale缩小到一定范围内,就像概率中相关系数是协方差的归一化结果。

    对定性型特征采用one-hot,对定量型特征采用归一化。最终结果使所有特征值均保持在-1~1或0~1间。

    归一化是为了消除特征间由于量纲不同而导致结果的偏差,使数据具有可比性。

归一化常用方法:

1. Min-Max Scaling            在0~1之间

y=(x-min)/(max-min)          类似均匀分布的累计分布函数

2. Z-Score Scaling            在-1~1之间

(x-mean)/std                      正态分布z值,服从正态分布

1. 通过sklearn.preprocessing.MinMaxScaler()实现

2. 可通过两种方法实现:

a. 通过sklearn.preprocessing.scale()

b. 通过sklearn.preprocessing.StandardScaler()

目前发现二者的区别是a是方法,b是类,b中包含了求均值和方差的方法。

b按列标准化,(x-列均值)/列方差,a可以根据行或列进行标准化,axis=0 按feature,即列,详见http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.scale.html

通常均用列,所以二者使用上没有什么本质区别。

相关文章

  • 数据归一化 Feature Scaling

    数据归一化 最值归一化 均值方差归一化

  • 数据归一化

    什么是数据归一化 ? 具体有哪些归一化 ? 为什么要归一化 ? 1. 什么是数据归一化 ? standardize...

  • Stata--标准化、归一化

    由来 标准化、归一化是我们经常遇到的需求,如下式子 标准化 归一化 整体标准化和归一化 分组标准化和归一化

  • [Stay Sharp]特征归一化

    特征归一化 零均值归一化(Z-score normalization) 零均值归一化会把特征值映射到均值为0、标准...

  • 六、数据特征预处理

    1 归一化 sklearn.preprocessing import MinMaxScaler(一)归一化处理:统...

  • 问卷数据的标准化

    1 Normalization Method(标准化 / 归一化) 1.1 归一化方法(Normalization...

  • 归一化、标准化和正则化及代码实现

    归一化、标准化和正则化都是对数据进行处理的,那么这三种有什么区别呢? 归一化(normalization) 归一化...

  • np.dot

    broadcasting 按照行归一化 softmax函数,常用在对多分类结果进行归一化。

  • PCA主成分分析

    PCA用于剔除线性依赖数据,但是计算之前,需要处理有异类数据和归一化变量单位。归一化方法有很多,比如01归一化,l...

  • 标准化和归一化小记

    首先看一下标准化和归一化的公式: 归一化 标准化 归一化和标准化的区别:归一化是将样本的特征值转换到同一量纲下把数...

网友评论

      本文标题:归一化

      本文链接:https://www.haomeiwen.com/subject/fpesyftx.html