美文网首页
pandas中按类型求占比

pandas中按类型求占比

作者: 殇_边城 | 来源:发表于2017-12-22 10:27 被阅读0次

方法一

import pandas as pd
df = pd.DataFrame({'typeid': [9, 379, 65002001, 9, 379, 379, 379, 2],
                   'sl': [100, 200, 300, 400, 500, 600, 700, 80]})
df['sum'] = df['typeid'].map(lambda x : df.loc[df['typeid']==x,['sl']].sum().squeeze())
#添加一列sum,按typeid类型计算sl列的和,squeeze()取标量
df['ratio'] = df['sl']/df['sum']

方法二

def get_ratio(grouped,column):
    return(grouped[column]/grouped[column].sum())
df['ratio'] = df.groupby('typeid').apply(get_ratio,column='sl')

相关文章

网友评论

      本文标题:pandas中按类型求占比

      本文链接:https://www.haomeiwen.com/subject/yrrtgxtx.html