美文网首页
【218-4-1阅读笔记】数据可视化图形

【218-4-1阅读笔记】数据可视化图形

作者: 李春辉 | 来源:发表于2018-04-11 23:21 被阅读15次

1. 时间序列数据可视化

1.1时间中的离散点

【1】柱形图

  • 处理数据都是正数,请永远让柱形图的数值轴从0开始,否则会让人们难以从视觉上比较各柱形的高度
  • 在选择柱形间隔时需要小心。如果间宽度和柱形宽度相近,视觉上就会产生振动效应,给人感觉柱形间隔的角色发生了互换。
  • 填充柱形色以及可以添加分隔线

【2】柱形的堆叠

  • 如果数据存在子分类,且各个分类之和有意义,我们就可以用到堆叠柱形图

【3】圆点

  • 如果用圆点代替柱形,表达的意思可能会更明确。点据空间小,不是距形,所以能更好体现出‘流’的感觉。
  • 散点图(scatterplot)可以表现非时间数据。通常用于表现两个变量之间的关系
  • 柱形图用就度作为视觉线索,散点图则用位置。
  • 散点图不必总是从0开始。(不过从0开始通常不错)

1.2延续性数据

【1】折线图:点与点相连

【2】 梯形图

  • 标准折线图的缺点之一是它必须表现从A到B点间的稳定变化。
    但有些数据长时间保持一个值,突然出现增长或衰退,(比如银行利率)对于这种类型的数据可以用梯型图。

【3】 曲线(拟合LOESS曲线)

  • 如果你手中的数据太多或杂乱无章,可能会很难辨认期中趋势或模式。为数据点拟合一条曲线。

2. 有关比例的可视化

在比例中我们通常寻求三个件事:最大值、最小值和总体分布。

2.1整体中的各个部分

【1】饼图

  • 饼图很容易会变乱,不适合应对较多值

【2】 面包圈图

  • 面包图很容易会变乱,不适合应对较多值

2.2 比例中的堆叠

【1】堆叠柱形图

【2】层级和矩形

  • 可以用板块层级图显示单纯的比例关系,不过在充分利用该技术的情况下,它更适合于显示层级结构,或者更确切的说,树状结构的数据。

2.3 带时间属性的比例

【1】堆叠的延续

假如你有多个时间序列图表,现在将它们从下往上堆叠,填满空白的区域。你得到一个堆叠面积图。
如果对这个面积图表进行垂直切片,得到该时间片段上的分布情况。

3.有关关系的可视化

探求不同变量间的关系,当某个数增加时,另一个数量是否会减少?它们之间是关联关系还是因果关系?

3.1关联性

关联意味着当一件事变化时,另一件事情也可能会发生某种变化。关联性可以帮助我们根据某一已知指标来预测另一指标。要想探究这种关系,先看一下散点图和多重散点图。

【1】更多的圆点

散点图表示随时间变化的指标。不仅可以表示随时间变化的变化(或不变化),也可以表现两个变量之间的关系。

  • 如果两个指标正相关,那么左往右读图,点的位置会越来越高
  • 如果两个指标负相关,那么点的位置越来越低
  • 如果点的排列没有明显模式,两个指标不相关。

【2】散点图矩阵

  • 散点图矩阵通常是一个方格网,在垂直和水平方向上都列出所有的变量。水平轴上每一列代表一个变量,垂直轴上的每一行也代表一个变量。这样提供了所有配对,

【3】气泡

  • 在用圆形表示数据时,要根据面积来定义,不是半径、直径、或周长。

3.2 分布

【1】老式的分布图表

【2】有关分布的柱形

【3】延续性的密度

3.3对照和比较

【1】多个分布图表

4. 发现差异

你的数据中包含多种变量,但你希望把所有对象进行分组,然后找出其中最出众的或者说异常值

4.1在多个变量间比较

【1】热身

  • 会得到一个与原始数据大小相同的网格,但根据单元格色的不同找出那些相关较高的或较低的数值。

【2】相面术(切尔诺夫脸谱图)

【3】星图

【4】平行前进

4.2 减少维度

4.3 寻找异常值

5. 有关空间关系的可视化

5.1具体位置

【1】找到纬度经度

【2】单纯的点

【3】有大有闰的点(气泡)

5.2 地区

【1】根据数据着色

5.3 跨越空间和时间

【1】 系列组图

【2】抓住差额

【3】动画

相关文章

网友评论

      本文标题:【218-4-1阅读笔记】数据可视化图形

      本文链接:https://www.haomeiwen.com/subject/cjyocftx.html