1、主要作用
这个和excel中分类汇总或者透视表实现的功能是一样的,比如有一组关于客户的数据,里面有客户的性别、年龄段等数据,现在想要知道每个年龄段每个性别有多少人。
2、常见应用1:单类分组
单类分组是指只有一个统计变量,如下面的统计字段['shot_zone_basic'] (数据是来自kaggle比赛数据)
![](https://img.haomeiwen.com/i7207288/7addceac330a712a.png)
以上的操作只能创建一个groupby对象,一般在应用中会加上要统计的方式,如下客户直接展示数据的多种统计指标,当然如果只需要统计一种统计指标可以直接将descrbe()替换成mean()、count()等。
![](https://img.haomeiwen.com/i7207288/cb6d77664dc0cfd0.png)
很多时候统计的指标和数据变量较多时,数据使用横排展示在视觉上很难看清,这时可以使用unstack()函数优化展示。
![](https://img.haomeiwen.com/i7207288/4f4f0a4d7666da23.png)
3、常见应用2:多类分组
多类统计是统计时有一个以上的变量,在实际工作中应用就是多个变量多个统计指标的统计方式,如下:
![](https://img.haomeiwen.com/i7207288/f7242172c1bc57b3.png)
![](https://img.haomeiwen.com/i7207288/f65e328f2d10704d.png)
4、groupby中匿名函数的应用
这种应用场景主要是针对在统计数据中某个字段时,仅统计字段中某一部分的内容,这个时候需要对字段进行自定义处理,如下:
![](https://img.haomeiwen.com/i7207288/14b26355d477ae9c.png)
网友评论