美文网首页
python 中groupby高频应用

python 中groupby高频应用

作者: 我就是鱼鱼鱼 | 来源:发表于2021-10-28 11:33 被阅读0次

1、主要作用

这个和excel中分类汇总或者透视表实现的功能是一样的,比如有一组关于客户的数据,里面有客户的性别、年龄段等数据,现在想要知道每个年龄段每个性别有多少人。

2、常见应用1:单类分组

单类分组是指只有一个统计变量,如下面的统计字段['shot_zone_basic'] (数据是来自kaggle比赛数据)

创建groupby对象

以上的操作只能创建一个groupby对象,一般在应用中会加上要统计的方式,如下客户直接展示数据的多种统计指标,当然如果只需要统计一种统计指标可以直接将descrbe()替换成mean()、count()等。

按组统计相关统计指标

很多时候统计的指标和数据变量较多时,数据使用横排展示在视觉上很难看清,这时可以使用unstack()函数优化展示。

unstack()可以理解为将原来横排变成竖排数据展示更好

3、常见应用2:多类分组

多类统计是统计时有一个以上的变量,在实际工作中应用就是多个变量多个统计指标的统计方式,如下:

多类统计 多类多方式统计

4、groupby中匿名函数的应用

这种应用场景主要是针对在统计数据中某个字段时,仅统计字段中某一部分的内容,这个时候需要对字段进行自定义处理,如下:

groupby中使用匿名函数整理统计数据

相关文章

网友评论

      本文标题:python 中groupby高频应用

      本文链接:https://www.haomeiwen.com/subject/dbwmaltx.html