1、主要作用
这个和excel中分类汇总或者透视表实现的功能是一样的,比如有一组关于客户的数据,里面有客户的性别、年龄段等数据,现在想要知道每个年龄段每个性别有多少人。
2、常见应用1:单类分组
单类分组是指只有一个统计变量,如下面的统计字段['shot_zone_basic'] (数据是来自kaggle比赛数据)

以上的操作只能创建一个groupby对象,一般在应用中会加上要统计的方式,如下客户直接展示数据的多种统计指标,当然如果只需要统计一种统计指标可以直接将descrbe()替换成mean()、count()等。

很多时候统计的指标和数据变量较多时,数据使用横排展示在视觉上很难看清,这时可以使用unstack()函数优化展示。

3、常见应用2:多类分组
多类统计是统计时有一个以上的变量,在实际工作中应用就是多个变量多个统计指标的统计方式,如下:


4、groupby中匿名函数的应用
这种应用场景主要是针对在统计数据中某个字段时,仅统计字段中某一部分的内容,这个时候需要对字段进行自定义处理,如下:

网友评论