pd.cut()相关

作者: 喝奶茶不加奶茶 | 来源:发表于2020-07-06 12:24 被阅读0次

pd.cut()数据分组:根据数据分析对象的特征,按照一定的数值指标,把数据分析对象划分为不同的区间部分来进行研究,以揭示其内在的联系和规律性。

函数用法:
pd.cut( series, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates='raise', )
参数解释:

bins :整数,标量序列或者间隔索引,是进行分组的依据,

如果填入整数n,则表示将x中的数值分成等宽的n份;
如果是标量序列(比如,[0,30,40,70]),序列中的数值表示用来分档的分界值

right=True表示分组右边闭合,right=False表示分组左边闭合,
labels表示分组的自定义标签。

labels : 数组或布尔值,可选.指定分箱的标签

如果是数组,长度要与分箱个数一致,比如“ bins”=[1、2、3、4]表示(1,2],(2,3],(3,4]一共3个区间,则labels的长度也就是标签的个数也要是3
如果为False,则仅返回分箱的整数指示符,即x中的数据在第几个箱子里

retbins: 是否显示分箱的分界值。默认为False,当bins取整数时可以设置retbins=True以显示分界值,得到划分后的区间

precision:整数,默认3,存储和显示分箱标签的精度。

include_lowest:布尔值,表示区间的左边是开还是闭,默认为false,也就是不包含区间左边。

duplicates:如果分箱临界值不唯一,则引发ValueError或丢弃非唯一

相关文章

  • pd.cut()相关

    pd.cut()数据分组:根据数据分析对象的特征,按照一定的数值指标,把数据分析对象划分为不同的区间部分来进行研究...

  • 数据的分箱,pd.cut和pd.qcut

    对于数据分箱,常用到的一个函数叫做pd.cut(),这个函数可以通过指定分箱个数或者每个箱体的分界值对数据进行分箱...

  • 32 幸福指数的等级分析

    数据分级的两种方法 apply方法自定义向量化操作,比循环效率高 cut方法用pd.cut指定边界 代码: 输出内...

  • Pearson相关、Spearman相关、Kendall相关

    1、三大相关系数 1.1 Pearson相关系数 要理解Pearson相关系数,首先要理解协方差(Covarian...

  • 2018前端面试总结,看完弄懂,工资少说加3K

    HTML相关 CSS相关 JAVASCRIPT相关 DOM相关 HTTP相关 VUE相关 算法相关 网络安全相关 ...

  • AS相关

    手动创建一个模块 手动创建一个模块,可以先写build.gradle文件,指明编译规则。 在项目的setting....

  • 相关

    错误地,我以为一切都相关 如同流云,河川,雨露 山之南,水之北, 旧日的,现在的 随手捡起的记忆 却不想也开了花,...

  • 相关

    vc 提取物 波色因

  • 相关

    打破"事不关己"这种避障吧 你与这个世界的任何事物都是息息相关的

  • this相关

    1.prototype2.extend3.this的定位 一、prototype 是为jquery的prototy...

网友评论

    本文标题:pd.cut()相关

    本文链接:https://www.haomeiwen.com/subject/nmmmqktx.html