美文网首页
SimpleImputer 中fit和transform方法的简

SimpleImputer 中fit和transform方法的简

作者: swan1024 | 来源:发表于2020-05-11 09:34 被阅读0次

    sklearn.impute.SimpleImputer 中fit和transform方法的简介

    SimpleImputer 简介

    通过SimpleImputer ,可以将现实数据中缺失的值通过同一列的均值、中值、或者众数补充起来,这里用均值举例。

    fit方法

    通过fit方法可以计算矩阵缺失的相关值的大小,以便填充其他缺失数据矩阵时进行使用。

    
    import numpy as np
    from sklearn.impute import SimpleImputer
    imp = SimpleImputer(missing_values=np.nan, strategy='mean')
    imp.fit([[1, 2], [np.nan, 3], [7, 6]])
    
    

    对于数组

    \begin{matrix} 1 & 2 \\ null & 3 \\ 7 & 6 \\ \end{matrix}

    经过imp.fit之后,第一列的均值为(1+7)/2=4,第二列的均值为(2+3+6)/3=3.6667

    X = [[np.nan, 2], [6, np.nan], [7, 6]]
    print(imp.transform(X))
    

    transform 方法

    之后给定一个X矩阵,通过transform方法进行转换。

    \begin{matrix} null & 2 \\ 6 & null \\ 7 & 6 \\ \end{matrix}
    填充第一个null为之前算的均值4,第二null为第二列均值3.6667

    fit_transform 方法

    一般我们实际使用时,对于给定的数据,直接使用fit_transform方法进行计算以及填充。

    相关文章

      网友评论

          本文标题:SimpleImputer 中fit和transform方法的简

          本文链接:https://www.haomeiwen.com/subject/fbuynhtx.html