美文网首页
Pandas 计算某一列的累加函数 cumsum

Pandas 计算某一列的累加函数 cumsum

作者: 王叽叽的小心情 | 来源:发表于2022-05-01 22:24 被阅读0次

需求:对于Pandas的dataframe的某一列数据,我们想要获取该列的数值从大到小依次的累积占比,即获取总量占比为50%时对应的是哪个数值。

函数:pandas.DataFrame.cumsum
作用:返回DataFrame或Series轴上的累计和
参数:DataFrame.cumsum(axis=None, skipna=True)

  • axis,可选参数有{0 or ‘index’, 1 or ‘columns’} 指定是横向的row还是纵向的column,0 代表是 ‘index’, 1 代表是‘columns’。
  • skipna,bool,默认是True,排除NA / null值。如果整个行/列为NA,则结果为NA。

代码示例如下:

df = df.sort_values(by=['value'], ascending=False)  # 按照字段value的降序进行排序
df['flow_cumsum'] = df['value'].cumsum()  # 计算flow的累计数值
df['flow_cumper'] = df_flow['flow_cumsum'] / df_flow['value'].sum() * 100  # 计算flow的累计比例

这样就可以绘图得到累积占比90%时所对应的flow的数值了,可以进行阈值筛选。

参考资料:https://pandas.pydata.org/pandasdocs/stable/reference/api/pandas.DataFrame.cumsum.html

相关文章

  • Pandas 计算某一列的累加函数 cumsum

    需求:对于Pandas的dataframe的某一列数据,我们想要获取该列的数值从大到小依次的累积占比,即获取总量占...

  • Pandas累加函数 cumsum()

    基础语法 DataFrame.cumsum(axis=None, skipna=True, *args, **kw...

  • 专升本手札16

    计算机: 1.常用内部函数 count 统计记录的个数 sum 计算某一列的总和 avg 计算某一列的平均值 2....

  • pandas学习笔记

    pandas 读取 csv 文件 查看pandas的列名以及列数 pandas 查看某一列的全部数据或部分数据 查...

  • numpy.cumsum()用法

    numpy.cumsum 函数参数有numpy.cumsum(a, axis=None, dtype=None, ...

  • 聚合函数

    聚合函数 AVG:求某一列平均值 COUNT:统计总行数 SUM:计算列总和 MIN:求某一列的最小值 MAX:求...

  • SQL函数

    sql有很多的用于计算或者计数的内置函数select function(列) from 表avg(列)求某一列的平...

  • Hive练习

    数据: 建表语句 1、输出的日期格式不一样,需进行格式化 2、计算每个用户的小计 计算累加列,开窗函数根据用户id...

  • Java工程师之Oracle技术-SQL入门(2)

    分组计算函数和GROUP BY字句 常用分组计算函数 SUM(列) 数值类型,计算和 AVG(列) 数值类型,计算...

  • pandas中级操作示例及说明记录1

    pandas中级操作示例及说明记录1 计算每行(即所有列)的mean值 计算列(即所有行)的mean值 计算每个值...

网友评论

      本文标题:Pandas 计算某一列的累加函数 cumsum

      本文链接:https://www.haomeiwen.com/subject/oedpyrtx.html