美文网首页
pandas cum系列函数

pandas cum系列函数

作者: 橘猫吃不胖 | 来源:发表于2020-05-28 14:43 被阅读0次

cum系列函数,都表示累计的意思,包括

  • cummax
  • cummin
  • cumsum
  • cumprod

这四个函数很相似,参数什么的基本一致


pandas.DataFrame.cummax

DataFrame.cummax(self, axis=None, skipna=True, *args, **kwargs)
Return cumulative maximum over a DataFrame or Series axis.

就是求一个累计的最大值,类似SQL中的max over()这种开窗函数

小栗子

s = pd.Series([2, np.nan, 5, -1, 0])
s.cummax()

就是按照某个轴,以此选取其中最大的一个值
索引为1的是NaN,是因为本身元素值就是NaN,默认其实是跳过NaN值的

df = pd.DataFrame([[2.0, 1.0],
                   [3.0, np.nan],
                   [1.0, 0.0]],
                   columns=list('AB'))

df.cummax()

默认是按照index来,也就是竖着来,一行一行
我们可以修改为axis=1

df.cummax(axis=1)

pandas.DataFrame.cummin

同上,这个就是取最小值的
DataFrame.cummin(self, axis=None, skipna=True, *args, **kwargs)

df.cummin()

因为默认是跳过NaN的,所以,注意最大值、最小值都是NaN

df.cummin(skipna=False)

pandas.DataFrame.cumsum

DataFrame.cumsum(self, axis=None, skipna=True, *args, **kwargs)

这个就是累计求和的函数,sum over()

df.cumsum()

pandas.DataFrame.cumprod

DataFrame.cumprod(self, axis=None, skipna=True, *args, **kwargs)

累计求乘积

df.cumprod()

相关文章

网友评论

      本文标题:pandas cum系列函数

      本文链接:https://www.haomeiwen.com/subject/aataahtx.html