美文网首页
给妹子讲python-S02E19GroupBy实现分割、应用和

给妹子讲python-S02E19GroupBy实现分割、应用和

作者: Python末末 | 来源:发表于2018-07-12 14:31 被阅读8次

    1.GroupBy的使用场景和使用方法2.GroupBy分割、应用和组合的操作内涵3.GroupBy对象的遍历

    今天这一集我们开始介绍Pandas中对数据进行处理的一个高逼格的方法:GroupBy。

    【妹子说】别说的这么厉害,我只问,这个是干嘛滴

    好,我举一个使用场景吧,科学家用不同的测量方法,测出了行星的质量、距离、轨道周期等等,就如同下面的代码所示:

    注意一下,这里的seaborn库是一个新的第三方库,我们用它来获取数据,我们在命令行下用pip3 install seaborn就能实现自动安装。

    好的,我问你,我要你对使用相同method测出来的distance进行求平均值,你要怎么求?

    【妹子说】额,莫不是就要用到你说的GroupBy?

    对,我们来做个示范:

    可以类比的是,他得到了一个SeriesGroupBy对象,也是一个中间变量。

    回到前面提的问题,获取了分组,如果我们想在此基础上求各个不同方法测得的distance的平均值,就非常简单了。

    这里可以使用的方法很广,包含了一般的统计方法:求和、求均值、求中位数、方差、累和、最值等常用方法。

    自然,describe方法也是可以在此使用的。

    用一下我们之前讲过的unstack方法将这个多重索引的Series对象转换成DataFrame对象,可读性更强:

    我们通过GroupBy方法获得的DataFrameGroupBy对象可以直接按分组进行迭代,每一轮迭代返回的对象是一个二元元组,包括对应的分组组名和这个组对应的DataFrame片段。

    相关文章

      网友评论

          本文标题:给妹子讲python-S02E19GroupBy实现分割、应用和

          本文链接:https://www.haomeiwen.com/subject/yfxmqftx.html