美文网首页
独热编码

独热编码

作者: ckawyh | 来源:发表于2017-03-22 15:34 被阅读0次

    关于独热编码的实现
    一. scikit-learn库

    import pandas as pd
    from sklearn.preprocessing import LabelEncoder
    from sklearn.preprocessing import OneHotEncoder
    
    testdata = pd.DataFrame({'pet':['cat', 'dog', 'dog', 'fish']})   
    a = LabelEncoder().fit_transform(testdata.pet)
    b = OneHotEncoder(sparse=False).fit_transform(a.reshape(-1, 1))
    
    # 拼接特征
    np.hstack((b, b))
    

    二. scikit-learn库

    from sklearn.feature_extraction import DictVectorizer
    vec = DictVectorizer(sparse=False)
    vec.fit_transform(testdata.to_dict(orient='record'))
    

    三. 使用pandas的get_dummies函数

    pd.get_dummies(testdata,columns=['pet'])
    

    相关文章

      网友评论

          本文标题:独热编码

          本文链接:https://www.haomeiwen.com/subject/ibmonttx.html