美文网首页coding过程中的一些小积累
pandas.cut与pandas.qcut使用方法与区别

pandas.cut与pandas.qcut使用方法与区别

作者: 徐卜灵 | 来源:发表于2018-10-23 21:09 被阅读0次

    pandas.cut:

    pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)
    

    参数:

    • x,类array对象,且必须为一维,待切割的原形式
    • bins, 整数、序列尺度、或间隔索引。如果bins是一个整数,它定义了x宽度范围内的等宽面元数量,但是在这种情况下,x的范围在每个边上被延长1%,以保证包括x的最小值或最大值。如果bin是序列,它定义了允许非均匀bin宽度的bin边缘。在这种情况下没有x的范围的扩展。
    • right,布尔值。是否是左开右闭区间
    • labels,用作结果箱的标签。必须与结果箱相同长度。如果FALSE,只返回整数指标面元。
    • retbins,布尔值。是否返回面元
    • precision,整数。返回面元的小数点几位
    • include_lowest,布尔值。第一个区间的左端点是否包含
      返回值:
    • 若labels为False则返回整数填充的Categorical或数组或Series
    • 若retbins为True还返回用浮点数填充的N维数组

    pandas.qcut

    pandas.qcut(x, q, labels=None, retbins=False, precision=3, duplicates=’raise’)
    

    参数:

    • x
    • q,整数或分位数组成的数组。
    • labels,
    • retbins
    • precison
    • duplicates
      结果中超过边界的值将会变成NA

    qcut: 等频分割
    cut: 等宽分割
    一般情况只需要关注前三个参数就行了!

    相关文章

      网友评论

        本文标题:pandas.cut与pandas.qcut使用方法与区别

        本文链接:https://www.haomeiwen.com/subject/xphzzftx.html