起因是我想给数据做个分布统计,但是数据太多了,画出来很杂,所以打算把数据按照范围做个分组,但是又不想自己写,所以找了好久的方法,目前也只有这两种偷懒的方法:
pandas->cut
arr = pd.cut(data_arr, cut_num) #cut_num表示要把数据分成几组
不过cut函数返回的是个categorical或者series类型,接口都比较少一些,能做的操作不多。如果纯展示或者只需要分类之后的区间,还是可以用的,但是要供后面的代码使用,还是有点费劲
numpy->np.arange
arr = np.arange(min(data_arr), max(data_arr), step) #每个区间的间隔
这样生成的是按照step产生的间隔,比较方便的是plt的时候,直接用做stick的刻度也很方便,也直接生成了array的区间,数据类型更灵活
网友评论