- “split-apply-combine” (拆分-应用-合并)
——Hadley Wickham
一、可视化理解
![](https://img.haomeiwen.com/i5128129/5985005a59d478fd.png)
- 键:一组用于拆分对象的值 (分组标准)
二、分组入门
- 以某列(col2)进行分组计算另一列(col1)的均值
1.先分后选(推荐)
df.groupby(df.col2).col1.mean()
2.先选后分
df.col1.groupby(df.col2).mean()
- 计算各分组的数据行数(数据量)
df.groupby(df.col2).size()
三、分组进阶
-
通过字典或Series进行分组(axis=1表示以横轴切分)
-
通过函数进行分组
任何被当做分组键的函数都会在各个索引值上被调用一次,其返回值就会被用作分组名称。
-
通过层次化索引名称分组
四、运算方法
-
基本方法
- 特殊方法:
- aggregate方法
- transform方法
- apply方法(最一般化)
网友评论