从此篇文章开始,记录一个数据小白的学习成长之路,初识,从数据可视化开始。
本文主要记录个人对于数据可视化的理解和学习概要,主要内容如下:
【全文】主题初识数据可视化
数据可视化背景
以实际工作场景例举,某物流公司的业务人员需要对某一季度的运单进行分析,包括对应单票的盈利情况、对应单票的流转情况、当前季度用户的下单情况等。
在这些场景下,所需要呈现出的可视化报表样式,均需基于对应的背景(主题)来进行数据的提取、聚焦、设计、展现。
使用场景
第三季度,华南、华北、津京冀三个区域的单票盈利情况。
目标用户
销售中心的业务人员。
呈现的结果
业务人员分析目的:旨分析出各区域的盈利对比情况,主要关注营业额、利润率、票数、环比四个重要指标。
通过目标用户需要分析的数据指标,来进行数据的提取和展示。这里需要对重要指标进行分析对应的关系,再来选择可呈现的可视化样式。
对应关系:
主要维度为时间(第三季度)、区域(华南、华北、津京冀);
重点指标:营业额、利润率、票数、环比。
可视化图标选择:
区域性可选择饼状图来进行对比分析,时间可选择连续性的柱状图和曲线图进行对比分析。
可视化展示的标准:
聚焦/平衡/简洁(以下图表很粗糙,所用echars元件库,接下来会进行优化)。
展示样式举例:
粗略的可视化报表
数据可视化流程
数据来源/采集
数据来源主要包含内部和外部(这里的业务数据均来源于内部采集的数据)。
数据处理
这里获取的数据,是基于“票”来采集的,所以会存在高维、海量、多样化的数据。
(此处借用数据大神的文章内容:在大数据时代,我们所采集到的数据通常具有4V特性:Volume(大量)、Variety(多样)、Velocity(高速)、Value(价值)。如何从高维、海量、多样化的数据中,挖掘有价值的信息来支持决策,除了需要对数据进行清洗、去除噪声之外,还需要依据业务目的对数据进行二次处理。常用的数据处理方法包括:降维、数据聚类和切分、抽样等统计学和机器学习中的方法。)
数据呈现
将我们目标用户业务背景下所需要分析的数据,映射出可视化报表呈现出来。
可视化映射是整个数据可视化流程的核心,是指将处理后的数据信息映射成可视化元素的过程。
可视化元素由3部分组成:可视化空间(二维/三维)+标记(点/线/面/体)+视觉通道(颜色/大小/宽度/高度/形状/方向等)(可视化分析流程)
用户感知
最后,数据产品经理/专员所设计出的可视化报表是否满足用户的需求,除数据验证外,还需要目标用户来验证可视化的标准是否达到预期。包括,重点指标是否突出、分析维度是否合理、颜色是否温和、页面是否平整等用户体验的感知反馈。
总结:
初实数据可视化,需要了解业务背景、目标用户、数据来源、数据如何处理、如何呈现可视化,总之多结合场景去分析,此处还是推荐(5W2H分析法),虽然个人能力不足,但会努力成长的~
努力向前,自律成长,未来可见~
网友评论