美文网首页
归一化处理

归一化处理

作者: 61etj | 来源:发表于2018-10-29 19:40 被阅读0次

数据归一化处理

为什么需要归一化呢?通常我们获取训练模型来训练时,很多数据大小参差不齐,比如有的特征可能值200000000,而有的特征是0.00123,那我们在进行大数计算的时候是非常消耗时间的,并且计算结果也会异常的大。另外权重分配也会不均匀,一般大的数获取到的权重可能更大。所以也许这个大的数并不是决定这个数据结果的最关键因素,结果因为数值大而变为最重要因素,这样我们预测就会出现问题了,把所有的数据映射到同一尺度当中----归一化就相应而生

最值归一化 normalization

把所有数据映射到0和1之间。适用有明显边界的情况;当边界大小和普遍数据值大小差距过大则也不适用

image
(x - np.min(x)) / (np.max(x) - np.min(x))

均值方差归一化 standardization

把所有数据归一到均值为0反差为1的分布中 。适用于没有明显边界的情况;有可能存在极端数据值

image
def transform(self, X):
    #计算每列的均值以及方差
    mean = np.array([np.mean(X[:,i]) for i in range(X.shape[1])])
    scale = np.array([np.std(X[:,i]) for i in range(X.shape[1])])

    resX = np.empty(shape=X.shape, dtype=float)
    for col in range(X.shape[1]):
        #给每个数据计算出归一化后的值
        resX[:,col] = (X[:,col] - mean[col]) / scale[col]
    return resX

使用 scikit-learn中的StandardScaler

from sklearn.preprocessing import StandardScaler 
standardScalar = StandardScaler() 
standardScalar.fit(X_train)#该方法内会就算出平均值和方差
standardScalar.mean_#平均值
standardScalar.scale_#方差
X_train = standardScalar.transform(X_train)#进行数据归一化

相关文章

  • 六、数据特征预处理

    1 归一化 sklearn.preprocessing import MinMaxScaler(一)归一化处理:统...

  • 一文做会漂亮的火山图

    一、通过limma包对输入数据进行处理 1、归一化处理 在利用limma包进行差异分析处理之前,要对数据进行归一化...

  • 特征工程

    问题 特征归一化 为什么要进行特征归一化? 方法? 使用场景? 离散型特征处理 为什么要处理? 方法? 特征组合 ...

  • 2019-10-12

    深度学习第六天 对输入数据的归一化和去均值处理: 归一化:...

  • 归一化、标准化和正则化及代码实现

    归一化、标准化和正则化都是对数据进行处理的,那么这三种有什么区别呢? 归一化(normalization) 归一化...

  • PCA主成分分析

    PCA用于剔除线性依赖数据,但是计算之前,需要处理有异类数据和归一化变量单位。归一化方法有很多,比如01归一化,l...

  • 神经网络的数据处理部分参考链接

    神经网络为什么要归一化 深度学习-----数据预处理 数据为什么要归一化 数据归一化后,最优解的寻优过程明显会变得...

  • 数据归一化方法

    【转载】数据归一化和两种常用的归一化方法 数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不...

  • 归一化处理

    数据归一化处理 为什么需要归一化呢?通常我们获取训练模型来训练时,很多数据大小参差不齐,比如有的特征可能值2000...

  • 归一化处理

    将不同维度的特征值都转换到同一个取值范围比如,0到1之间。比如A维度取值范围是1000到2000,而B维度取值范围...

网友评论

      本文标题:归一化处理

      本文链接:https://www.haomeiwen.com/subject/trjitqtx.html