美文网首页
Tableau Desktop2020.2新功能数据关系实装~

Tableau Desktop2020.2新功能数据关系实装~

作者: Charles_DT | 来源:发表于2020-06-06 15:38 被阅读0次

    美好的周六,今天带你来体验以下Tableau Desktop2020.2数据关系功能~

    功能介绍

    在2020.2.2版本中,Tableau加入了最新的概念:数据关系。可以把它理解为在以前的数据连接形式之上添加了一层数据逻辑层。这么做要解决什么样的问题?
    简化多表分析的数据连接,使合并表的流程更加简单,简化数据源管理,让更多不懂sql的小白能免去很多数据质量问题的困扰。
    新的数据关系跟以前的表连接有什么区别呢?

    官方的解释~
    不明白动态组合没关系,我们来实操一下

    实践

    下载最新的Tableau2020.2,并安装。
    数据关系主要解决多表连接产生的数据重复问题,我们来准备一个简单的数据,你只要在excel里自己做一个如下数据即可:


    店铺信息
    销售明细

    做好以后,打开Tableau,连接数据源,顺利的话你的界面应该如下:



    我们把店铺分析拖动到画布区:
    这里会出现一个方格
    这就是数据关系层,目前里面只包含了店铺分析这张表。先来做一个店铺面积的分析对比,很简单。

    接下来我们用原来的数据连接方式,连接每个店铺的销售额情况。双击到方格中,拖入销售明细表,就是你熟悉的界面啦。



    回到工作表页面,问题出现了:
    店铺面积翻倍了!
    为什么会这样呢?因为我们的店铺信息表中只有两行店铺数据,而店铺对应的销售表中阿迪有6条数据,所以当表连接时,数据翻了6倍,耐克有四条数据,表连接时翻了4倍。专业术语时表连接时产生了笛卡尔积。

    当然,你可能会说,那我聚合的时候求平均不就好了吗,确实,求平均可以解决笛卡尔积的问题:


    现在销售额和面积的数据都很正常了

    现在我们再来加入合计:


    面积又发生了问题
    合计面积是怎么计算的呢?
    结果表中面积汇总之后求了平均

    这样显然不是我们想要的结果。在以前的版本怎么解决这个问题?需要用到lod,如果你有兴趣可以自己研究一下,我把公式放在下面。


    那么,新版本遇到这个问题是怎么解决的呢?我们调整以下数据连接方式,改成用关系连接:


    拖动销售明细到店铺分析右侧,自动连线

    这里其实两个表是独立的,Tableau建立了一层数据关系,我们回到工作表界面:


    重复数据消失了!

    总结

    数据关系是两个表中需要连接的数据做了逻辑层的连接,并不会join物理表,所以数据不会翻倍。
    非常非常实用的功能,强烈推荐你实践一下!


    相关文章

      网友评论

          本文标题:Tableau Desktop2020.2新功能数据关系实装~

          本文链接:https://www.haomeiwen.com/subject/njgttktx.html