1. 时间序列数据可视化
1.1时间中的离散点
【1】柱形图
- 处理数据都是正数,请永远让柱形图的数值轴从0开始,否则会让人们难以从视觉上比较各柱形的高度
- 在选择柱形间隔时需要小心。如果间宽度和柱形宽度相近,视觉上就会产生振动效应,给人感觉柱形间隔的角色发生了互换。
- 填充柱形色以及可以添加分隔线
【2】柱形的堆叠
- 如果数据存在子分类,且各个分类之和有意义,我们就可以用到堆叠柱形图
【3】圆点
- 如果用圆点代替柱形,表达的意思可能会更明确。点据空间小,不是距形,所以能更好体现出‘流’的感觉。
- 散点图(scatterplot)可以表现非时间数据。通常用于表现两个变量之间的关系
- 柱形图用就度作为视觉线索,散点图则用位置。
- 散点图不必总是从0开始。(不过从0开始通常不错)
1.2延续性数据
【1】折线图:点与点相连
【2】 梯形图
- 标准折线图的缺点之一是它必须表现从A到B点间的稳定变化。
但有些数据长时间保持一个值,突然出现增长或衰退,(比如银行利率)对于这种类型的数据可以用梯型图。
【3】 曲线(拟合LOESS曲线)
- 如果你手中的数据太多或杂乱无章,可能会很难辨认期中趋势或模式。为数据点拟合一条曲线。
2. 有关比例的可视化
在比例中我们通常寻求三个件事:最大值、最小值和总体分布。
2.1整体中的各个部分
【1】饼图
- 饼图很容易会变乱,不适合应对较多值
【2】 面包圈图
- 面包图很容易会变乱,不适合应对较多值
2.2 比例中的堆叠
【1】堆叠柱形图
【2】层级和矩形
- 可以用板块层级图显示单纯的比例关系,不过在充分利用该技术的情况下,它更适合于显示层级结构,或者更确切的说,树状结构的数据。
2.3 带时间属性的比例
【1】堆叠的延续
假如你有多个时间序列图表,现在将它们从下往上堆叠,填满空白的区域。你得到一个堆叠面积图。
如果对这个面积图表进行垂直切片,得到该时间片段上的分布情况。
3.有关关系的可视化
探求不同变量间的关系,当某个数增加时,另一个数量是否会减少?它们之间是关联关系还是因果关系?
3.1关联性
关联意味着当一件事变化时,另一件事情也可能会发生某种变化。关联性可以帮助我们根据某一已知指标来预测另一指标。要想探究这种关系,先看一下散点图和多重散点图。
【1】更多的圆点
散点图表示随时间变化的指标。不仅可以表示随时间变化的变化(或不变化),也可以表现两个变量之间的关系。
- 如果两个指标正相关,那么左往右读图,点的位置会越来越高
- 如果两个指标负相关,那么点的位置越来越低
- 如果点的排列没有明显模式,两个指标不相关。
【2】散点图矩阵
- 散点图矩阵通常是一个方格网,在垂直和水平方向上都列出所有的变量。水平轴上每一列代表一个变量,垂直轴上的每一行也代表一个变量。这样提供了所有配对,
【3】气泡
- 在用圆形表示数据时,要根据面积来定义,不是半径、直径、或周长。
3.2 分布
【1】老式的分布图表
【2】有关分布的柱形
【3】延续性的密度
3.3对照和比较
【1】多个分布图表
4. 发现差异
你的数据中包含多种变量,但你希望把所有对象进行分组,然后找出其中最出众的或者说异常值
4.1在多个变量间比较
【1】热身
- 会得到一个与原始数据大小相同的网格,但根据单元格色的不同找出那些相关较高的或较低的数值。
网友评论