第五章 时变数据可视化
时间通常被认为是一种主观上的体验,然而在可视化中,时间却成了一个结构化的维度。时间是一个非常重要的属性及维度,它可以帮助我们构筑稳健而直观的可视化框架,帮助我们动态地看待各个事件的发展。事物都是随着时间变化的,因此时间维度,就代表着一个历史,代表着一种过程,从宏观的角度来看,时间就代表着过去、现在和未来。
随着时间变化或者带有时间相关属性的数据,我们通常称为时变型数据,时变型数据主要有以时间轴排列的时间序列的数据,比如零售企业销售数据、股市交易数据、传感器的监测数据等。也有不以时间为变量的,但是其也拥有一定的顺序,,如DNA测序、化学质谱等,这类数据可以将变化的顺序作为时间轴来处理。上述两种数据类型都是有序型数据。
时变型数据在实际生活以及各个领域中已经应用非常广泛,从人口数量的增长规律到企业业务中年报月报的制作,再到日常的销售趋势等,我们都能感受到时间线的身影。
在可视化中,如果将时间属性作为X轴的变量,那么每个Y轴数据就是每个时间点发生的单个事件。对于时间属性的分类,我们一般划分成三种。
(一)线性时间和周期时间
若以可视化的角度来描述线性时间,则可以把时间序列作为X轴,随时间变化而变化的数据作为Y轴的变量,形成一个简单的二维图形,如同下图5-1,显示了销售数据随着时间变化的规律,此图虽然表达出了在线性时间中销售的变化情况,但是却无法表达出销售数据的周期性变化。
图5-1
为了体现时变型数据的周期性结构,图5-2将时间序列沿环状排列,利用环形来布局时间轴,一个环形代表一个周期。从环状图中可以展现出数据集的周期性特征。图中展现的是某零售企业近三年时间内的销售情况。
图5-2
(二)时间点和时间间隔
所谓时间点也叫时间和空间的一个盲点,也叫时刻,是时间上的某个瞬间,或是时间轴上的某个点,时间点是静止的,任何物质都是因时间的运动而运动的,而在盲点也就是时间点的物体就不会改变,其处于一个静止的状态。例如双十一00:00这一时刻的销售情况。在可视化中,各个时间点作为X轴的变量,而每一时刻事物的状态作为Y轴的变量,形成一个二维图形,如图5-3,展现的是当前每时每刻的销售状态,是瞬间数据。
图5-3
时间段又称时间间隔,指的是客观物质运动的两个不同状态之间所经历的时间历程,时间段是描述计划的时间粒度单位。划分时间段的目的就是为了准确说明计划在各个时间段上的需求量、计划量和产出量。通常采用的时间段粒度是天、周、月、季和年等。计划中的时间段粒度愈小,则该计划愈容易得到准确的描述、执行和控制。例如下图5-4,分析销售情况,一般分析的是某一个时间段内的销售总额,而不是单纯的某个时间点的销量。
图5-4
(三)顺序时间、分支时间和多角度时间
顺序时间即按照事理发展过程的先后来介绍某一事物的说明顺序。凡是事物的发展变化都离不开时间,如说明生产技术、产品制作、工作方法、历史发展、文字演变、人物成长、动植物生长等等,都应以时间为序。
而分支时间,则代表着在同一时间内,展开多个分支同时进行,这有利于增加工作的效率,多线作战。
多角度时间相当于多个不同的角度来观察同一个事物,为了竟可能完整地呈现某一件事情或者行为,一般都会从各个角度来描述或者记录,例如坐在篮球场馆不同的位置,观看着同一场比赛,又或者同一时间内的销售情况,可以从不同的维度进行分析。
区域角度时间
产品角度时间
什么是多变量时变型数据?其指的就是有多个变量的时变型数据,这种数据在实际业务中非常常见。有多个变量,就意味着需要兼顾更多。例如在数据分析过程中,往往需要先对数据进行抽象和重构,将更具特征性的变量剥离,进而对这些特征变量做进一步分析,挖掘其蕴含的细节,整个流程基本就是“全局展示,突出重点——筛选重点,进一步分析刻画细节”,归纳成三点,即数据抽象、数据聚类以及特征分析。
(一)数据抽象
数据抽象是指对实际的人、事、物或者数据中抽取所关心的共同特性,而忽略非本质的细节,并把这些关键特征用各种概念或者可视化精确地加以描述。
(二)数据聚类
数据聚类就是将数据集按照不同的特性,划分成多个具有某些相似特征的子集的操作。实际上,在对数据进行聚类的过程中,也相当于对数据进行了抽象。
(三)特征分析
特征分析主要包括特征抽取、语义分析等,在对一份高维时变型数据进行特征分析时,通常会先假设数据之间有某种规律,然后基于可视化技术,求证假设是否成立。
网友评论