数据可视化对于来说一直是一个似是而非的领域,对于该领域知识仅停留在表层。下决心跟着居士认真学习一番。enjoy~
一、什么是数据可视化
数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。但是这并不意味着数据可视化就一定因为要实现其功能用途而令人感到枯燥乏味,或者是为了看上去绚烂多彩而显得极端复杂。---from百度
二、数据可视化基本概念
1)数据空间
由n维属性和m个元素组成的数据集所构成的多维信息空间
2)数据开发
利用一定的算法和工具对数据进行定量的推演和计算
3)数据分析
指对多维数据进行切片、块、旋转等动作剖析数据,从而多角度多侧面观察数据
4)数据可视化
指将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程
三、为什么要做数据可视化
一句话概括:
美丽!直观!抓重点!
四、如何做数据可视化
数据可视化以相关图表承载数据。一图胜千言就是这个意思,前提是选择合适的表达形式。
PS:没有绝对正确的图表,只有合适的。
五、数据可视化图表都有哪些
居士讲到,根据数据形态,可分为2大类:
1、时序数据可视化
所谓时序数据,就是任何随着时间而变化的数据,比如一天当中气温的变化,PM2.5的变化等。
要进行时序数据的可视化,我们首先需要了解「时间」所具有的特征:
1)有序性:时间都是有序的,事件之间有先后顺序。
2)周期性:许多自然或商业现象都具有循环规律,如季节等周期性的循环。
3)结构性:时间的尺度可以按照年、季度、月、日、小时、分钟、秒等去切割。
「时间数据」按是否连续可分为:离散型时间和连续型时间两类,时间类型的差异决定了图表的表现形式也不同。
离散型时间的可视化
对于分布在离散时间的数据的可视化,可以采用柱状图、堆叠柱状图、散点图来表示。
柱状图 堆叠柱状图 散点图连续时间的可视化
连续时间通常采用图表有:折线图、阶梯图和拟合曲线图。
折线图2、比例性数据可视化
比例数据,通常是按照类别、子类别、群体进行的划分。对于比例型数据,我们进行可视化的目的,是为了寻找整体中的最大值、最小值、整体的构成分布、以及各部分之间的相对关系。
常见图表有:饼图、环形图、百分比柱状图、百分比堆叠面积图等。
饼图 环形图另外,根据业务形态,常见的还有矢量图、热力图、雷达图、漏斗图等。
矢量图 热力图 雷达图 漏斗图更多资料信息详见居士公众号:数据科学家联盟
网友评论