1. https://www.zhihu.com/question/31989952/answer/54184582
2. https://blog.csdn.net/u010358304/article/details/80693541
连续特征离散化的基本假设,是默认连续特征不同区间的取值对结果的贡献是不一样的。
所以希望连续特征在不同的区间有不同的权重,实现的方法就是对特征进行划分区间,每个区间为一个新的特征。常用做法,就是先对特征进行排序,然后再按照等频离散化为N个区间.
无监督方法: 分箱法和直观划分. 分箱法又分为等宽分箱法和等频分箱法
有监督方法:
网友评论