本文出自我的好友,Excel图表大神:苏有熊。
为保持风格一致,稍作排版和内容修改,具体可以点击【阅读原文】。
更多图表干货,请关注《商业图表指南》。
这两天我工作中遇到一个新问题,需要比较两组数据的整体差异性,各有约900个数据点。
从数据结构上来看,是关于 900个类别对象、两组相关数据 的度量值;而本质上,这可以算是,一个统计问题,术语可以称作“多样本的成对数据分析”。
/ 1 /
从一个散点图开始
900个数据密密麻麻,单凭对数据的直接观察,很难看出什么东西来。
于是我画了下面这张图,通过可视化的方式去比较这两组数据的整体差异表现:
img简单说明一下,这个图表的阅读方法:
1- XY轴最大最小值相同(但是Y轴不等距,为对数刻度),表示数据X和Y因子。加入一条趋势线,可以清晰的表达数据的X和Y坐标关系。
2- 理论上来讲,离趋势线越近的数据点,其XY值之间的差异越小。
为了验证这个猜测,我挑选了几个趋势线上的数据点,利用数据标签显示其XY值,得到如下图形:
img成功!趋势线将整个数据区域分割成了两个对等的区域。
拉登解说:因为Y轴是对数刻度,所以视觉上看着是不对等的....
另外,仔细观察,我们不难发现,图表中的几条规律。
1- 趋势线的上方区域,表示Y值大于X值;反之,趋势线的下方,表示X值大于Y值。
2- 通过图形观察数据点与趋势线的分离程度,则可以直观反映出所有数据对象两个度量值的整体差异。
3- 加入R平方值可以量化这个两组数据的吻合度,在这里R平方值等于0.8661,可以看做两组数据的整体吻合程度达到了86.61%,差异是一个较小的程度。
拉登解说:为了让图表的信息传递的更精确,备注图表的阅读方法、关键信息,是非常有必要的,也能体现图表作者的专业度。
/ 2 /
7个会说话的图表
通过上面这个案例,我们可以感受到图表的魅力:让数据变的更加的直观,简单易懂!
实际上,这种呈现的方式在《经济学人》的图表中最为常见。
下面是从经济学人的图表库中挑选的一些例图,我们来感受一下,其应用的方式和细节的处理。
1- 高血压患病率分析图
img这个图表的数据,源自是对数十个国家高血压患病率的采样分析,目标是确定高血压的性别差异,其中:
1- X轴为女性高血压的患病率
2- Y轴为男性高血压的患病率
这张图的样式非常好。利用一条对角线将散点图分为对等的两部分,我们可以很清楚的观察出:
1- 数据点,大部分落在上方的三角区域(男性)。这表明,大部分所选国家,男性高血压的患病率远高于女性,女性患病率高于男性的,集中在部分非洲国家;
2- 黄色圆点(高收入西方国家)代表的高血压患病率,整体处于较低水平。
3- 相对的,深蓝色圆点(中欧和东欧国家的男性)高血压患病率在所有样本国家中处于最高水平。
通过对样本国家以所属地理位置的分组,也可以很清晰的观察出各地域之间的差异。
2-GDP和献血次量关系分析图
img这个图反映的是,样本国家的人均GDP,和每1000人献血次数的两组度量值的成对比较。
上面的类似,但是稍有不同的是,分割数据区域的趋势线是一个弧形,将XY轴的其中一个设置为对数刻度可以实现这个效果。同样的:
1- 高于趋势线的数据点所代表的国家,居民的献血意愿较强;
2- 反之,趋势线以下的,献血意愿较低。
3- 出生率和财富关系图
img第2个图表中,两指标间呈现正相关,而上面这张例图,两指标间呈负相关关系。
4-政府工信度和媒体满意度关系图
img同样的,图中的斜线代表政府工信度,和媒体可信度的关系。
1- 数据越靠上,代表更相信媒体的可信度。
2- 数据越靠下,则代表相信政府的工信度。
5-男女员工薪酬对比图
img数据偏向右侧,表示男性的薪水,高于女性的薪水。
6- 薪酬分布图
img7- 一胎生育年龄直方图
img/ 3 /
商业图表巨头《经济学人》
以上7幅世界顶尖水准的例图,除例图5来自于FT金融时报外,其余均来自于世界商业图表领域的巨头、或者说是王者——《经济学人》。
大家可以细细品味每一张图表的制图思路,以及细节处理。
更多优质的图表,可以通过下面几种方式,关注经济学人。
1- 官方网站
http://www.economist.com/(需要梯子)
2- 官方微博
image.png3- 官方微信公众号
image.png看得多了,遇到合适的案例数据,试着去用自己熟悉的工具去实现,其表现力将是强大的,外观也称得上超凡脱俗、别具一格。
最后强调一句,以上图表样式,均可以用Excel实现。
footer本文首发公众号【拉小登】
我是拉小登,源于Excel,不只是Excel
网友评论