数据可视化的前世今生
1、很久以前
信息,无论是对于史前的人们,还是9102年的小仙女小仙男,都像是水对于鱼一般的重要。信息传递的过程,就像是开会,如果平铺直叙,大家就会昏昏欲睡,数据可视化能帮助读者立刻GET关键点。
从广义来说,史前人类就已经开始使用象形图来记录信息。随着文字的出现,图表所含的信息更加凝练,渐渐出现地图、技术绘图等不同形式,但并不能与现代图表等同。
图片来源:网络
2、数据图表的发展
17世纪开始,信息呈现有了基于数据的特征。Michael Florent van Langren 在1644年绘制了堪称里程碑的作品。大M绘制了从托莱多到罗马之间12个当时已知的经度差异,并在经度上标注了观测的天文学家的名字。
数据图表在之后经历了爆发式的增长。William Playfair (1759-1823)是苏格兰的工程师,政治经济学家以及统计图形方法的奠基人之一。Playfair 在图表界可是莎士比亚般的存在,他不仅创造了线图、饼图等日常普遍使用的统计图表,还发明了抽象展示数据结构的方法,推动了数据可视化的发展。
19世纪,南丁格尔不仅是护理界的“一姐”,在数据可视化领域也“两开花”。在战后她整理了英军死亡人数及原因,绘制了著名的“玫瑰图”,揭示了真正影响战争死亡人数的是军队的医疗保障。在其努力下,英国皇家陆军卫生委员会成立。
19世纪中期,法国工程师 Charles Joseph Minard (1781-1870)在他生命最后20年创作了著名的《拿破仑1812远征图》,因此被称为“法国的Playfair”。这张图的经典之处在于,以二维图表展示了时间、地理坐标、温度、法军前进撤退方向等丰富信息,以出众的视觉表现力揭示了拿破仑指挥法军入侵俄罗斯的惨败原因。因此被称为
3、数据可视化的繁荣
20世纪开始,数据可视化更多在科学研究中崭露头角。英国经济与统计学家 Arthur Bowley(1869-1957)引入时间序列图光滑化的方法,绘制了1855-1899年间不列颠和爱尔兰的出口总值,推动了探索性数据分析的发展。说人话,他的方法可以减少短期数据波动对预测的干扰,得到更加平滑的趋势曲线。
在此期间,另一个重要主题是地铁。工业化的发展,一方面推动了人口的增加,另一方面使得现代交通产业得到了发展,地铁应运而生。伦敦地铁有过多次扩建,这成了设计师的盛宴,地铁路线图的可视化引起讨论。1933年,Harry Beck(1902-1974)绘制的地铁图已经和现代地铁图相差无几,这种拓扑图之后被广泛应用于地铁路线呈现。
20世纪后半叶,数据可视化重点在多维数据可视化方面发力。美国统计学家 JohnW. Tukey (1915–2000)创造了茎叶图、盒形图等常用图表类型。箱形图(如下图所示),主要反映了数据的分布情况。上下端线分别为数据的两端非异常极值,中间矩形的上下边为数据的四分位数,中间横线为中位数,异常值以圈表示在上下限之外(嗯,让我看看这节还有多少理科生在看🤓)。
现代 GIS(地理信息系统)的发展,也使得地理图表重新受到重视。1974年美国人口统计局发布的胃癌发生率地图很好地结合了地理信息与医疗指标。
21世纪的今天,数据图表成为重要的信息载体,以及和数据八卦姐一样有趣的存在~数据可视化也开始向更具设计性和交互性发展。
图表的分类
一龙生九子,九子各不同,同样的数据使用不同的图表样式就会带来完全不一样的效果,以下是图表的一些常见分类:
1、分布
主要反映项目的出现次数,较常使用的有折线图、面积图、雷达图、散点图、词云图等。
2、趋势
重点在于突出数据变化的规律或趋势。较常使用的有动态条形图、折线图、面积图、柱状图、气泡图、玫瑰图和漏斗图等。
3、比较
主要对于同类数据在不同变量情况下进行比较,重点在于突出数据中的某一特点。较常使用的有河流图、柱状图、玉珏图、哑铃图等。
4、组成
主要对于部分和整体关系进行可视化展现,具体多以百分比的形式给出。较常使用的有堆叠柱状图、环图、漏斗图等。
5、关联
主要反映数据间的相关程度,通过可视化的方式,突出数据背后存在的不同关联。较常使用的有哑铃图、数图、桑基图等。
图表知识千千万,听我个个说来看,要做图表老司机,咋办?关注转发加评论👍敬请期待下期更多有趣的图表知识分享~
参考资料:
1.《读图时代|信息图形设计》,陈皓
2.《不只是美:信息图表设计原理与经典案例》,Alberto Cairo,罗辉,李丽华
3.《干货|如何选择正确的图表类型》,小烦没救了 from 豆瓣小组“数据视觉化”
4.《数据可视化简史》,阿道克 from 豆瓣小站“数据铺子”
好看的图表形态各异,制作的工具简单如一,快来Hanabi体验不一样的图表吧~
网友评论