美好的周六,今天带你来体验以下Tableau Desktop2020.2数据关系功能~
功能介绍
在2020.2.2版本中,Tableau加入了最新的概念:数据关系。可以把它理解为在以前的数据连接形式之上添加了一层数据逻辑层。这么做要解决什么样的问题?
简化多表分析的数据连接,使合并表的流程更加简单,简化数据源管理,让更多不懂sql的小白能免去很多数据质量问题的困扰。
新的数据关系跟以前的表连接有什么区别呢?

不明白动态组合没关系,我们来实操一下
实践
下载最新的Tableau2020.2,并安装。
数据关系主要解决多表连接产生的数据重复问题,我们来准备一个简单的数据,你只要在excel里自己做一个如下数据即可:


做好以后,打开Tableau,连接数据源,顺利的话你的界面应该如下:

我们把店铺分析拖动到画布区:

这就是数据关系层,目前里面只包含了店铺分析这张表。先来做一个店铺面积的分析对比,很简单。

接下来我们用原来的数据连接方式,连接每个店铺的销售额情况。双击到方格中,拖入销售明细表,就是你熟悉的界面啦。

回到工作表页面,问题出现了:

为什么会这样呢?因为我们的店铺信息表中只有两行店铺数据,而店铺对应的销售表中阿迪有6条数据,所以当表连接时,数据翻了6倍,耐克有四条数据,表连接时翻了4倍。专业术语时表连接时产生了笛卡尔积。
当然,你可能会说,那我聚合的时候求平均不就好了吗,确实,求平均可以解决笛卡尔积的问题:

现在我们再来加入合计:

合计面积是怎么计算的呢?

这样显然不是我们想要的结果。在以前的版本怎么解决这个问题?需要用到lod,如果你有兴趣可以自己研究一下,我把公式放在下面。

那么,新版本遇到这个问题是怎么解决的呢?我们调整以下数据连接方式,改成用关系连接:

这里其实两个表是独立的,Tableau建立了一层数据关系,我们回到工作表界面:

总结
数据关系是两个表中需要连接的数据做了逻辑层的连接,并不会join物理表,所以数据不会翻倍。
非常非常实用的功能,强烈推荐你实践一下!

网友评论