美文网首页
Udacity 数据分析进阶课程笔记L40:特征缩放

Udacity 数据分析进阶课程笔记L40:特征缩放

作者: 有刺客 | 来源:发表于2018-04-20 15:42 被阅读0次
  1. 通过衣服尺码的例子,介绍一种使用特征缩放的简单情况
  2. 一种简单的特征缩放公式(归一化)和实现


    归一化特征缩放公式
# Python code
def featureScaling(arr):
    scale = max(arr) - min(arr)
    res = []
    for elem in arr:
        res.append( float(elem - min(arr))/scale )

    return res
  1. sklearn中的Min-Max Scalar特征缩放器
# 课程中与此例不同,直接使用了 fit_trasform() 函数
>>> from sklearn.preprocessing import MinMaxScaler
>>>
>>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
>>> scaler = MinMaxScaler()
>>> print(scaler.fit(data))
MinMaxScaler(copy=True, feature_range=(0, 1))
>>> print(scaler.data_max_)
[  1.  18.]
>>> print(scaler.transform(data))
[[ 0.    0.  ]
 [ 0.25  0.25]
 [ 0.5   0.5 ]
 [ 1.    1.  ]]
>>> print(scaler.transform([[2, 2]]))
[[ 1.5  0. ]]
  1. 哪些算法的结果会收到特征缩放的影响? image.png
  2. 特征缩放迷你项目。

相关文章

网友评论

      本文标题:Udacity 数据分析进阶课程笔记L40:特征缩放

      本文链接:https://www.haomeiwen.com/subject/nvdgkftx.html