美文网首页Python数据分析我爱编程
20、pandas的透视表pivot_table

20、pandas的透视表pivot_table

作者: 让数据告诉你 | 来源:发表于2017-12-28 16:27 被阅读0次

    透视表pivot_table()是非常强大的汇总运算函数。 在SQL语句和excel中透视表也是非常普遍的。

    pivot_table()的主要参数有:

    pivot_table()的主要参数

    源数据:

    源数据

    使用pivot_table()进行透视表操作:

    使用pivot_table()进行操作

    values是要进行汇总、统计等运算的列,可以是多个(list格式);

    index是作为新表的列名,可以是多个(list格式);

    columns是作为新表的列名,可以是多个(list格式);

    aggfunc是做汇总的统计运算方法,常用的简单运算都可以,也可以是多种方法(每个不同的列指定一种方法),这样就可以免去了多次使用透视表在进行合并的麻烦。

    使用多种计算方法:

    分别使用sum和len进行计算

    # 有趣的是多个汇总方法如果用aggfunc=['sum','count'],就会报错。而如果用numpy库的方法就正常(没有count函数)。

    在不同的列使用不同的运算方法,可以使用字典的形式表明汇总方法:

    用字典的形式表明汇总方法

    不过这个跟excel的透视表相比还是缺少了一个汇总行,我们可以使用margins=True来添加行列合计

    使用margins=True来添加行列合计

    还可以使用margins_name=' '来修改汇总行列的名称,当然了也可以使用rename()来修改:

    margins_name=' '来修改汇总行列的名称

    fill_value = 0是用来填充缺失值、空值。

    dropna=True是跳过整行都是空缺值的行。

    这样我们就把pivot_table()的参数都介绍了,pivot_table是经常使用的一个函数,结合简单的计算函数一起使用会有很好的效果。

    我们还可以把经过pivot_table()处理过的数据导出到电脑的excel文件里:

    导出到电脑的excel文件里 导出后的文件

    相关文章

      网友评论

        本文标题:20、pandas的透视表pivot_table

        本文链接:https://www.haomeiwen.com/subject/hsrvgxtx.html