美文网首页
Pandas之cut函数完成数据分组

Pandas之cut函数完成数据分组

作者: 测试探索 | 来源:发表于2021-11-28 12:46 被阅读0次

    一、cut函数介绍

    cut(Series,bins,right = True,labels = null )
    Series:需要分组的数据【数据框的某列数据】
    bins:分组的划分数组【列表】
    right:分组的时候右边是否闭合,默认闭区间
    labels:分组的自定义标签

    实现步骤

    1、数据准备
    df = pd.read_excel("PycharmProjects/untitled/this/ant-learn-pandas/testforpandas/data1.xlsx",engine = "openpyxl")
    print(df.head())
    
    image.png
    2、对人均GDP分组
    bins = [min(df["人均GDP"]) - 1,2000,4000,6000,8000,max(df["人均GDP"]) + 1]
    print(bins)
    
    df["人均GDP分组"] = pd.cut(df.人均GDP,bins)
    print(df)
    
    image.png
    3、自定义标签
    #自定义标签
    labels = ["2000一下","2001~4000","4001~6000","6001~8000","8000以上"]
    df["人均GDP分组"] = pd.cut(df.人均GDP,bins,labels = labels)
    print(df)
    
    image.png

    相关文章

      网友评论

          本文标题:Pandas之cut函数完成数据分组

          本文链接:https://www.haomeiwen.com/subject/uxdqxrtx.html