预处理与缩放（归一化/标准化/正则化）

预处理与缩放（归一化/标准化/正则化）

作者: dreampai | 来源:发表于2019-01-14 16:17 被阅读0次

关于使用sklearn进行数据预处理 —— 归一化/标准化/正则
预处理与缩放（归一化/标准化/正则化）
Dogs vs. Cats比赛——代码调试&模型优化笔记
数据预处理中归一化（Normalization）与损失函数中正则
机器学习篇(二)
均一化和标准化
Spark -- 数据的特征缩放
python 特征工程概述
机器学习中，有哪些特征选择的工程方法？
归一化、标准化和正则化及代码实现

StandardScaler 确保每个特征的平均值为 0、方差为 1，使所有特征都位于同一量级。
MinMaxScaler 移动数据，使所有特征都刚好位于 0 和 1 之间。
Normalizer 它对每个数据点进行缩放，使得特征向量的欧式长度等于 1 。

1、归一化（StandardScaler ）

公式为： (X-mean)/std 计算时对每个属性/每列分别进行。

将数据按期属性（按列进行）减去其均值，并处以其方差。得到的结果是，对于每个属性/每列来说所有数据都聚集在0附近，方差为1。

from sklearn.preprocessing import StandardScaler
import numpy as np

X = np.array([[ 1., -1.,  2.],
               [ 2.,  0.,  0.],
               [ 0.,  1., -1.]])

scaler=StandardScaler()
scaler.fit(X)
print(scaler.mean_)
print(scaler.var_)
print(scaler.transform(X))

2、将属性缩放到一个指定范围

使用这种方法的目的包括：

对于方差非常小的属性可以增强其稳定性。
维持稀疏矩阵中为0的条目。

在构造类对象的时候也可以直接指定最大最小值的范围：feature_range=(min, max)，此时应用的公式变为：

X_std=(X-X.min(axis=0))/(X.max(axis=0)-X.min(axis=0))
X_scaled=X_std/(max-min)+min

from sklearn.preprocessing import MinMaxScaler
import numpy as np

X = np.array([[ 1., -1.,  2.],
               [ 2.,  0.,  0.],
               [ 0.,  1., -1.]])

scaler=MinMaxScaler()
X_train_minmax=scaler.fit_transform(X)
print(X_train_minmax)

3、正则化

from sklearn.preprocessing import Normalizer
import numpy as np

X = np.array([[ 1., -1.,  2.],
               [ 2.,  0.,  0.],
               [ 0.,  1., -1.]])

scaler=Normalizer(norm='l2')
X=scaler.fit_transform(X)
print(X)

相关文章

关于使用sklearn进行数据预处理 —— 归一化/标准化/正则
【原】关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化 - ChaoSimple - 博客园 s...
预处理与缩放（归一化/标准化/正则化）
StandardScaler 确保每个特征的平均值为 0、方差为 1，使所有特征都位于同一量级。 MinMaxSc...
Dogs vs. Cats比赛——代码调试&模型优化笔记
1 图像预处理 1.1 标准化和归一化相关资料机器学习面试之归一化与标准化 - 简书CNN 入门讲解：什么是标准...
数据预处理中归一化（Normalization）与损失函数中正则
数据预处理中归一化（Normalization）与损失函数中正则化（Regularization）解惑背景：数据...
机器学习篇(二)
特征预处理：目的：方便我们下一步的处理。数值类数据：缩放：归一化，标准化，缺失值处理类别型数据：one-ho...
均一化和标准化
数据的标准化（normalization）和归一化数据的标准化（normalization）将数据按比例缩放，...
Spark -- 数据的特征缩放
Spark -- 数据的特征缩放(Feature scaling) 特征缩放：有的叫数据归一化，有的叫数据标准化，...
python 特征工程概述
1 特征工程是什么？ 2 数据预处理2.1 无量纲化2.1.1 标准化2.1.2 区间缩放法2.1.3 标准化与归...
机器学习中，有哪些特征选择的工程方法？
目录1 特征工程是什么？2 数据预处理2.1 无量纲化2.1.1 标准化2.1.2 区间缩放法2.1.3 标准化与...
归一化、标准化和正则化及代码实现
归一化、标准化和正则化都是对数据进行处理的，那么这三种有什么区别呢？归一化（normalization）归一化...

网友评论

本文标题：预处理与缩放（归一化/标准化/正则化）

本文链接：https://www.haomeiwen.com/subject/xjqjdqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|预处理与缩放（归一化/标准化/正则化）|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！