什么是桑基图
桑基图是流图 ( flow diagram ) 的一种,用来描述能量,人口,经济等的流动情况。最早由爱尔兰人Matthew Henry Phineas Riall Sanke提出。Sankey是一名船长也是工程师,1898年Sankey在土木工程师学会会报纪要的一篇关于蒸汽机能源效率的文章中首次推出了第一个能量流动图,后来被命名为Sankey图,中文音译为桑基图。
桑基图主要关注能量、物料或资本等在系统内部的流动和转移情况。起始流量和结束流量相同;在内部,不同的线条代表了不同的流量分流情况,它的宽度成比例地显示此分支占有的流量;节点不同的宽度代表了特定状态下的流量大小。
桑基图可以可视化网络中节点之间的各种“流”。下图就表达了2050年英国能量生产和能力消耗的模拟结果。图左边是能量供给,右边是能量需求,中间的节点则表达了能量在最终消耗之前是如何被转化和传输的。每个条带的厚度表示了能量“流”的大小。
制作方法
制作桑基图常用软件有:R、sankey、echarts、tableau、D3等,但往往需要一定的编程基础。而现在一般的在线数据分析工具都可以制作桑基图,例如BDP个人版,界面简洁可视化,仅需要简单拖拽几下就可以制作出漂亮的桑基图,下面就以BDP个人版为例给大家讲解桑基图的制作方法:
案例说明
小粒开了一家零食网店,小粒在元旦期间借着节日做了一场满减活动,在假期结束之后,小粒想要分析元旦活动期间顾客下单购买商品的情况。
任务分解
1、确定好要分析的维度和数值
BDP中,桑基图的图表要求是2个维度和1个数值,案例中的维度:日期&购买状态,数值:顾客ID。
2、准备好的数据(部分数据如下图)

3、可视化分析

图表说明
以顾客(p0001、p0002和p0003,简称p1、p2和p3)为例说明:p1、p2和p3三人在1月1号时都处于将商品加入购物车的状态;在2号的时候p3为已付款状态,而p1和p2却是处于下单状态;在3号的时候p3为申请退款状态,而p1和p2为付款状态。
操作步骤
Step 1 :在“工作表”页面上传需要分析的工作表数据,或者直接选用数据库或第三方平台的文件数据,在需要分析的工作表数据右上方点击“新建图表”;

Step 2:在“编辑图表”页面,将需要分析的数据字段分别拖拽至维度栏(案例中的日期和购买状态)和数值栏(案例中的顾客ID)中,在右侧图表中选中“桑基图”,并设置流程主体字段(案例中的顾客ID),还可以根据喜好调整图表的颜色(如下图),一张高大上的桑基图就完成啦。
优秀案例
1869年,查尔斯米纳德(Charles Minard)绘制的1812年拿破仑征俄图(Map of Napolean's Russian Campaign of 1812)
2009年美国能源产出的分布以及能源的用途和损耗图,从图中可以明显看出主要的能源浪费发生于发电和交通。点击这里可以查看原文交互式信息图表。
其他优秀的案例:

网友评论