分组分析是指根据字段分组,将分析对象划分成不同的部分,以进行对比分析各组之间的差异性的一种分析方法。
常用的统计指标:计数、求和、平均值
分组统计函数:
groupby(by=[分组列1,分组列2,...])[统计列1,统计列2,...].agg({统计列别名1:统计函数1,统计列别名2:统计函数2,...})
参数说明:
by:用于分组的列
中括号:用于统计的列
agg:统计别名显示统计值的名称,统计函数用于统计数据
常用统计函数:size计数,sum求和,mean均值
但是当我使用这个函数时,系统报错
FutureWarning: using a dict on a Series for aggregation is deprecated and will be removed in a future version
或者
FutureWarning: using a dict with renaming is deprecated and will be removed in a future version return super(DataFrameGroupBy, self).aggregate(arg, *args, **kwargs)
这是由于Python升级不再使用这个函数语法了。
经修改
PyCharm正常运行。
原始数据
data分组统计后:
aggResult
网友评论