美文网首页Machine_Learning
scikit_learn学习笔记六——scikit_learn里

scikit_learn学习笔记六——scikit_learn里

作者: 深思海数_willschang | 来源:发表于2018-08-31 09:34 被阅读71次

    scikit_learn里的fit与fit_transform

    # 从sklearn.preprocessing导入StandardScaler
    from sklearn.preprocessing import StandardScaler
    # 标准化数据,保证每个维度的特征数据方差为1,均值为0,使得预测结果不会被某些维度过大的特征值而主导
    ss = StandardScaler()
    # fit_transform()先拟合数据,再标准化
    X_train = ss.fit_transform(X_train)
    # transform()数据标准化
    X_test = ss.transform(X_test)
    
    • 二者的功能都是对数据进行某种统一处理(比如标准化~N(0,1),将数据缩放(映射)到某个固定区间,归一化,正则化等)

    • fit_transform(partData)对部分数据先拟合fit,找到该part的整体指标,如均值、方差、最大值最小值等等(根据具体转换的目的),然后对该partData进行转换transform,从而实现数据的标准化、归一化等等。

    • tansform(restData)根据对之前部分fit的整体指标,对剩余的数据(restData)使用同样的均值、方差、最大最小值等指标进行转换transform(restData),从而保证part、rest处理方式相同。


      fit_transform
    • 必须先用fit_transform(partData),之后再transform(restData)

      如果直接transform(partData),程序会报错

    • 如果fit_transfrom(partData)后,使用fit_transform(restData)而不用transform(restData),虽然也能归一化,但是两个结果不是在同一个“标准”下的,具有明显差异。

    image.png

    相关文章

      网友评论

        本文标题:scikit_learn学习笔记六——scikit_learn里

        本文链接:https://www.haomeiwen.com/subject/yzrjwftx.html