美文网首页
分组运算:GroupBy技术

分组运算:GroupBy技术

作者: 陈昱熹 | 来源:发表于2017-12-19 22:36 被阅读0次
  • “split-apply-combine” (拆分-应用-合并)
               ——Hadley Wickham

一、可视化理解

  • 键:一组用于拆分对象的值 (分组标准)

二、分组入门

  • 以某列(col2)进行分组计算另一列(col1)的均值
1.先分后选(推荐)
df.groupby(df.col2).col1.mean()
2.先选后分
df.col1.groupby(df.col2).mean()
  • 计算各分组的数据行数(数据量)
    df.groupby(df.col2).size()

三、分组进阶

  • 通过字典或Series进行分组(axis=1表示以横轴切分)


  • 通过函数进行分组
     任何被当做分组键的函数都会在各个索引值上被调用一次,其返回值就会被用作分组名称。


  • 通过层次化索引名称分组


四、运算方法

  • 基本方法


  • 特殊方法:
    1. aggregate方法
    2. transform方法
    3. apply方法(最一般化)

相关文章

网友评论

      本文标题:分组运算:GroupBy技术

      本文链接:https://www.haomeiwen.com/subject/mngiwxtx.html