美文网首页
《数据可视化基础》第一章:把数据放到图表上

《数据可视化基础》第一章:把数据放到图表上

作者: drlee_fc74 | 来源:发表于2020-06-15 07:57 被阅读0次

以下部分是基于《Fundamentals of Data Visualization》学习笔记,要是有兴趣的话,可以直接看原版书籍: https://serialmentor.com/dataviz/

所谓的数据可视化

我们在很多文章当中可以看到各种各样的图形。例如:散点图、条形图、热图……这些图形看似没有什么关系。但其实他们都有一个共同的特征就是,这些数据都是基于数据绘制出来的。这种把数据经过一定的转换变成图形的过程就是数据可视化。

image

对于数据可视化而言,什么样的数据,绘制什么样子的图形基本都是固定的。所以我们只要了解了数据的类型。那之后就可以通过数据的分类来寻找做什么样的图。

数据类型

对于数据的分类,我们首先可以简单的根据数据是不是数字分成定量数据定性数据。其中定量数据就是指数字,对于数字而言,还可以分成连续性变量和离散变量。而定性数据则属于文本类型的描述。这样的描述也可以都属于分类变量。但是文本描述的话可以通过有没有顺序分成有序变量和无序变量。。另外的话,我们在处理数据的时候,也经常遇到日期的特殊类型的变量以及文本这种自由的变量。

<colgroup><col span="1" width="159"><col span="1" width="160"><col span="1" width="160"><col span="1" width="160"></colgroup>

数据类型 例子 变量类型 描述
定量数据/连续性数值 1.3, 5.7, 83, 1.5x10-2 连续性变量 可以是任何数值
定量数据/离散数值 1,2,3,4 分类变量 数字以离散单位表示
定性数据/无序分类 狗、猫、鱼 分类变量 没有任何的顺序,不同变量类别之间不存在比较关系。
定性数据/有序分类 不好、比较好、好 分类变量 变量和变量之间存在一定的关系。有明显的顺序
日期/时间 Jan. 5 2018, 8:03am 连续/分类 特定的日期或者时间
文本 这里是转折点 不是变量/分类变量 自由格式的文本。 如果需要,可以视为分类。

例如在下面的例子当中提供了美国四个地点的每日温度正常值(30年窗口内的平均每日温度)。 该表包含五个变量:月份,日期,位置,站点ID和温度(以华氏度为单位)。 其中月是有序的分类变量;天是离散数值;位置和站点ID是无序分类变量;温度则是连续性数值。

<colgroup><col span="1" width="127"><col span="1" width="128"><col span="1" width="128"><col span="1" width="128"><col span="1" width="128"></colgroup>

Month Location 站点ID Temperature
Jan 1 Chicago USW00014819 25.6
Jan 1 San Diego USW00093107 55.2
Jan 1 Houston USW00012918 53.9
Jan 1 Death Valley USC00042319 51.0
Jan 2 Chicago USW00014819 25.5

将数据值放到图形上

一个图形而言包括很多组成部分,例如图形的位置、形状、大小、颜色、线条宽度、线条类型等等等等。我们将图形当中的每一个部分叫做标度(scale)。

因此数据可视化的过程基本上分成两个步骤。

  1. 把想要绘制的数据和图形的不同的标度对应上,我们称这个过程为映射

  2. 选择合适的图形把映射表现出来。对于这个选择也是有一定原则的,这个我们在后面会慢慢讲的

image

例如👆美国四个地点的每日温度的例子,我们把温度值映射到Y轴;把每天的日期映射到X轴;把不同的地区映射到颜色上;最后通过线条来可视化这些结果。就有了一下的这个图形

image

同样的,如果我们把不同地区映射到Y轴,然后把温度映射到颜色上,最后通过正方形来可视化结果。然后就有了👇的热图

image

以上两个图形都是使用了x轴、y轴和颜色三个标度。只不过基于不同标度的映射对象不同以及可视化呈现的不同就表现出不同的图形了。

同样的,我们可以把三个标度变成多个标度。例如👇的图,就是有x、y轴的位置标度、颜色标度、大小标度和形状标度。五个标度来呈现一个图形。

image

相关文章

  • 《数据可视化基础》第一章:把数据放到图表上

    以下部分是基于《Fundamentals of Data Visualization》学习笔记,要是有兴趣的话,可...

  • H5 新特性01

    Canvas 基础 canvas应用领域 游戏 可视化数据(图表) banner、炫酷效果 地图 ...

  • 数据可视化——图表设计

    数据可视化是将数据信息梳理整合后图形化,将数据的内在联系和其意义更清晰高效表达的手段。图表设计是数据可视化最基础常...

  • 几种常见的数据可视化分析图表

    可视化技术的高速发展带动着数据的进步。数据可视化的数据分析图表,借助于可视化的大屏,将数据以图表的形式进行汇总分析...

  • 数据可视化Echarts

    什么是数据可视化? 什么是数据可视化呢?为了清晰有效地传递信息,数据可视化使用统计图形、图表、信息图表和其他工具,...

  • 第二章 数据

    第一章 数据可视化简介 第二章 数据 2.1数据释义 2.1.1 数据基础 (1)结构化数据 IT系统产生的数据,...

  • 机器学习算法:回归(理论)

    1. 鸢尾花 demo 检查数据最好的方法是将其可视化,将所有数据放到一张图表中,制作散点图(scatter pl...

  • 用matplotlib和seaborn做数据可视化

    数据可视化就是使用图形图表等方式来呈现数据,图形图表能够高效清晰地表达数据包含的信息。数据可视化在各个领域都得到了...

  • 数据可视化基础知识

    1. 数据可视化简介 创建图表探索数据并分享结果数据可视化:量化信息的可视化 2. 为何使用数据可视化? 安斯库姆...

  • 数据可视化图表的使用方式及最佳做法,你用对了吗?

    我们在工作中经常会用到数据,如今为了更加方便的数据图表,一些企业采用数据可视化图表,制作数据可视化大屏;本文作者介...

网友评论

      本文标题:《数据可视化基础》第一章:把数据放到图表上

      本文链接:https://www.haomeiwen.com/subject/kdaqxktx.html