美文网首页
【Python】特征的离散化

【Python】特征的离散化

作者: 元气小地瓜 | 来源:发表于2019-12-11 20:40 被阅读0次


    1.1二值离散化  Binarizer


    矩阵二值化

    注意: Binarizer输入ndim必须是2维,否则报错!!!!


    维度错误(提示通过reshape改为2维)


    1.2   多阈值离散化  np.digitize


    两者离散化结果不一样

    1.3 np.digitize(X,bins,right='False')

    X可以是np.array也可以是pd.DataFrame

    bins为阈值可以是单个数 例如bins=[20](一个数对应二值化),也可以是多个数,例如bins=[11,20,40],多个数对应多个阈值的离散化


    1,4总结

    np.digitize更好用!且np.digitize包含了Binarizer的功能,当bins为一个数时,np.digitize的功能与Binarizer的功能一模一样!

    相关文章

      网友评论

          本文标题:【Python】特征的离散化

          本文链接:https://www.haomeiwen.com/subject/syyagctx.html