美文网首页
数据的理解

数据的理解

作者: 旭Louis | 来源:发表于2017-11-25 15:13 被阅读0次

维度

维度主要是三大类的数据结构:文本、时间、数值。地区的上海、北京就是文本维度(也可以称为类别维度),销售额度就是数值维度,时间更好理解了。不同图表有维度使用限制。

维度可以互换

年龄原本是数值型的维度,但是可以通过对年龄的划分,将其分类为小孩、青年、老年三个年龄段,此时就转换为文本维度

散点图

散点图的优势是揭示数据间的关系,发觉变量与变量之间的关联。

折线图

折线图是观察数据的趋势,它和时间是好基友,当我们想要了解某一维度在时间上的规律或者趋势时,就用折线图吧。

柱形图

柱形图的对比分析,通过颜色区分类别。当需要对比的维度过多,柱形图是力不从心的。

柱形图和折线图在时间维度的分析中是可以互换的。但推荐使用折线图,因为它对趋势的变化表达更清晰。

柱形图还有许多丰富的应用。例如堆积柱形图,瀑布图,横向条形图,横轴正负图等。

image

地理图

一切和空间属性有关的分析都可以用到地理图。比如各地区销量,或者某商业区域店铺密集度等。

地理图一定需要用到坐标维度。可以是经纬度、也可以是地域名称(上海市、北京市)。坐标粒度即能细到具体某条街道,也能宽到世界各国范围。

饼图

饼图经常表示一组数据的占比。可以用扇面、圆环、或者多圆环嵌套。商务类的汇报中应用较多。

为了表示占比,拼图需要数值维度。

饼图是有缺陷的,它擅长表达某一占比较大的类别。但是不擅长对比。30%和35%在饼图上凭肉眼是难以分辨出区别的。当类别过多,也不适宜在饼图上表达。

雷达图

也叫蛛网图。它在商务、财务领域应用较大,适合用在固定的框架内表达某种已知的结果。常见于经营状况,财务健康程度。

image

箱线图

它能准确地反映数据维度的离散(最大数、最小数、中位数、四分数)情况。凡是离散的数据都适用箱线图。

image

热力图

以高亮形式展现数据。

最常见的例子就是用热力图表现道路交通状况。

image

关系图

展现事物相关性和关联性的图表,比如社交关系链、品牌传播、或者某种信息的流动。

image

有一条微博,现在想研究它的传播链:它是经由哪几个大V分享扩散开来,大V前又有谁分享过等,以此为基础可以绘制出一幅发散的网状图,分析病毒营销的过程。

image

矩形树图

柱形图不适合表达过多类目(比如上百)的数据,那应该怎么办?矩形树图出现了。它直观地以面积表示数值,以颜色表示类目。

下图中各颜色系代表各个类目维度,类目维度下又有多个二级类目。如果用柱形图表达,简直是灾难。用矩形树图则轻轻松松。

image

电子商务、产品销售等涉及大量品类的分析,都可以用到矩形树图。

桑基图 Sankey Diagram

它常表示信息的变化和流动状态。

网站用户分析,监控活跃数据的变化

image

活跃数据比单纯的表格清晰多了,而且我们也能够显著观察到不同活跃层的变化。万千变化,存乎一图

漏斗图

大名鼎鼎的转化率可视化,它适用在固定流程的转化分析,你也可以认为它是桑基图的简化版。说实话,随着个性化推荐和精准运营越来越多,漏斗转化有它的局限

转化率也可以用几组数字表示,不一定做成漏斗图。

相关文章

网友评论

      本文标题:数据的理解

      本文链接:https://www.haomeiwen.com/subject/wxjcbxtx.html