阅读顺序:
- 帕累托分析
- 数据准备
- powerbi 制作帕累托图
一、帕累托分析
帕累托分析是一种将帕累托原则应用于数据的统计技术,通常被称为二八规则。帕累托原则基于这样的假设:相对较少的投入(20%)对结果/产出(80%)影响最大。例子包括:
• 其中20%的产品占销售额的80%
• 其中20%的客户占利润的80%
虽然它被称为二八规则,但结果通常不会完全以二八的比例出现。接近这个比例的任何东西都被认为是正常的。有了这些结果,我们可以将业务重点放在影响80%结果的20%的事情上。
二、 数据准备
假设数据蛙datafrog公司经营9种产品,每种产品贡献的利润如下
1.数据生成
import pandas as pd
d={'product':['A1','A2','A3','A4','A5','A6','A7','A8','A9'],
'profit':[2720,1240,660,470,268,260,154,105,57]}
# 在画帕累托图时记得按照利润进行降序排序,这里生成数据时已做
df=pd.DataFrame(data=d)
2.数据处理
要实现帕累托图,是需要一个累加函数cumsum,下面看使用的结果
df['cumsum_profit']=df['profit'].cumsum()
df['cumsum_profit_rate']=df['cumsum_profit']/sum(df['profit'])
# 有同学反应,powerbi中展示中文好辩别,于是重命名中文名
df=df.rename(columns={'product':'产品','profit':'利润',
'cumsum_profit':'累计金额','cumsum_profit_rate':'累计占比'})
这里大家观察下,如:第一行累计利润是利润第一行,第二行累计利润是利润前两行相加,第三行累计利润是利润前三行相加,其他行也是如此,这便是cumsum函数的作用。
三、 powerbi 制作帕累托图
df.to_excel('cumsum_profit.xlsx',index=False)
数据存储到excel,然后加载到powerbi,选用如下的折线和簇状柱形图
把[产品]作为共享轴,[利润]作为列值并按降序排列,[累计占比]作为行值,一个简单的帕累托图就出来了
这里我们不难发现帕累托图只是由一个降序排列的柱形图和一个升序排列的百分比折线图的。
可是通过这个简单的帕累托图可以直观的看出,前3个产品的贡献占比就约为80%,它们就是要找的核心产品,应重点对待,而其他产品的累计贡献却只有20%左右,在资源有限的情况下,就不应该花费太多精力放在这些产品上面。
网友评论