Tableau的视图中,胶囊的颜色有蓝色和绿色的区分,蓝色代表离散数据,绿色代表连续数据。
字符串或者布尔类型的数据默认是离散型,且不能随意转换成连续类型。
数值类型的数据默认是连续型,可以通过右键菜单进行离散和连续的自由转换。
日期类型函数比较特殊,默认是离散型,但也可以通过右键菜单进行离散和连续的自由转换。
在绘制图表的过程中,离散数据和连续数据的作用是完全不同的。
我个人对此的总结是:
“连续数据画坐标,离散数据画表格”
连续数据画坐标,比较好理解,只要是连续性数据放到行或者列上,自然形成了一个坐标轴。
离散数据画表格,就有一些需要注意的知识点了。
下面我们做一个最简单的表格,这个表格里有几个单元格有几个分区?
答案是3个单元格,1个分区。怎么样看更直观呢?我们可以通过菜单栏里的“设置格式-边界”修改一下默认设置,来更直观的区分。
通过上图就可以直观地看出3个单元格(蓝色虚线)和一个分区(红色实线)。
有人会问,这个很重要吗?
我个人认为非常重要,因为了解这些底层逻辑,才能分清楚tableau能绘制哪些图表,不能绘制哪些图表。
比如大家最常问的,Excel里多柱图和折线图结合的图表,tableau能画吗?
答案是:默认不能画,但可以通过曲线救国的方式画出来。
那么为什么不能画,这就需要了解上面说的底层逻辑了。
我们再画一个折线图,大家可以看到,红色区域(也就是分区),就像一堵墙一样,截断了折线图。
分区决定了图形的范围,这点非常重要。也就是说,如果你的视图被离散类型的数据分割成不同的区域了,那么这些区域之间是独立的,图形是不能连在一起的。
我们把上面的类别和子类别,调换一下顺序,就更明显了。此时分区就是最小的单元格,所以折线图就不可能出现了。
那么这里还有一个问题,就是最小分区由谁来决定?
如果是多个离散数据,那么最右侧的离散数据决定分区的大小。
Toan Hoang大神的《Tableau Magic EpicViz vol.1》,这篇文章里介绍的图形就很好的说明了这点,最后结果里,线段是完全连在一起的。
但是如果我们拆解一下,把X轴右侧大于200,那么线段就断开了,因为分区是无法穿过的。
好了,看完大神的例子,还可以再进一步看到,分区里面是可以套坐标轴的。
大家注意到,蓝色胶囊永远在绿色胶囊的前面,也就是离散数据确定了分区以后,连续数据再确定坐标轴。
当然,如果没有离散数据,也变成了最上面说的连续数据画坐标,这时整个视图就可以理解为一个分区。
再回到上面说的多柱图和折线图结合的图表,大家看下图,就应该能明白为什么默认图形是不能画的了。那么曲线救国的方法是什么呢?大家可以留言,有时间我会单写一篇文章介绍方法。
好了上面就是今天的内容(上面的部分图形和表格没有实际意义,只为说明底层逻辑)。
最后复习一下。
连续数据画坐标,离散数据画表格
最右侧的离散数据决定了最小分区,最小分区又决定了图表的范围
此篇文章已发布到我的公众号: saodisir,有兴趣也可关注一下
网友评论