美文网首页Tableau实例操作
优阅达“优分享”| 2018 Tableau 峰会『干货帖』:通

优阅达“优分享”| 2018 Tableau 峰会『干货帖』:通

作者: 阿达_优阅达 | 来源:发表于2018-09-18 13:08 被阅读0次

    为什么要学习计算字段?在 Tableau 中,当数据未提供回答问题所需的信息时,创建计算字段非常有助你实现自助式分析。

    主要用途有以下几种:将数据分段;转换字段的数据类型,例如将字符串转换为日期;聚合数据 ;筛选结果;计算比率;集成如 R 之类的外部服务等......

    下面,我们将从宏观整体角度,介绍每种计算类型及运用场景案例,帮助你循序渐进地了解计算,更好挖掘数据。一睹为快吧

    计算类型及实例介绍

    计算通常分为3种类型,分别是基本计算字段、表计算以及详细级别表达式(LOD)。

    『类型一:基本计算字段』

    首先,聚合函数我们比较常用的就是SUM、AVG或者是MIN、MAX。还有包括统计学中的中位数,求相关性等,这些也属于聚合函数。

    数字函数,我们常用的是ZN函数,ZN函数会将在连续日期时突然缺失的那几天转换为0,日期少几天,ZN函数就会补多少个0。

    用户函数,比较偏向于 IT 场景,它会获取我们进入登陆 Server 的一个人的名字,这时可以用 USENAME 来做一个权限设置。

    字符串函数内有一个是包含的函数,有时我们设置权限表,会有一个USE,一个权限,这时如果权限重复,数据会翻倍。所以此时换一种方式,比如说我们按照地区来设权限,把字符串内的函数包括和 Usename 结合在一起使用,此时数据不会翻倍。这个小知识,IT人员可以考虑这样设置权限。

    ▌案例:零售行业的指标是如何计算?

    利润=营业额-单件成本*数量

    利润率=总利润/总营业额

    折扣=1-营业额/销售吊牌金额

    客户数=客户名称计数不同

    交易次数=订单ID计数不同

    客单价=总营业额/客户数

    连带率=总数量/交易次数

    坪效、人效、完成率、存销比……


    『类型二:表计算』

    表计算是嵌入在 Tableau 中的快速计算方法。快速表计算,总共有8类,我们可以做差异,可以做移动平均,可以做百分比差异、百分比、总额百分比、百分位,排名、汇总之类的一个计算,它相当于基于一个计算结果(聚合结果)做了一个二次计算。

    瀑布图:用到汇总计算,通过汇总算出每一个点,它相当于是一个高点,做一个汇总   排序凹凸图:无法查看具体数值,但可以了解每辆车排名的升降情况  

    除了刚刚那几个函数之外,我们还可以去集成 R、MATLAB 和 Python 。我们以 R 为例,它其实是做一个表计算,把表计算的结果以及一个代码发送到 Server,然后 R 代码就会进到 R,产生一个 R 值,最后返回到表计算里面。

    ▌案例:表计算的集成

    ❶ SCRIPT 函数-集成外部服务-以 R 为例

    将表达式传递到外部服务以与 R、MATLAB 和 Python 集成的函数。

    ❷ 集成外部服务-以 R 为例

    1.下载 R

    2.下载,安装和调用 R serve

     a. install.packages("Rserve")

     b. library(Rserve)

     c. Rserve()

    3.在 Tableau Desktop 中连接 R:

    帮助 -> 设置与性能 ->管理外部服务器连接

    4.输入服务器名称, 端口号为 6311

    5.测试连接!


    『类型三:详细级别表达式(LOD)』

    详细级别表达式是三个函数,fixed、Exclude、Include,它相当于在改变你的视图级别,有的时候你双击,你的视图就根据你双击的那些字段来划分它的详细级别,但是有的时候你的计算级别不一样,这时候就会用到详细表达 LOD。

    Fixed:指定确切的详细级别,独立于可视化内容所用维度实现

    Exclude:以较高详细级别进行计算,删除某一维度执行计算

    Include:以较低详细级别进行计算,创建粒度较高的表达式

    ▌案例:客户分析 LOD

    比如,找出每个客户订购的订单数是比较简单的,但是如果我们想了解订购过一个订单、两个订单、三个订单(依次类推)的客户数目,该怎么办呢? 如果要生成相应视图,我们必须按订购的订单数划分客户数。

    再比如,在我们的订单数据里面,一个客户可能存在多次购买,那么新客户增长情况如何?越早购买的客户对后来销售额的贡献会越大吗?各个地区客户争取情况每日趋势如何?

    另外,争取新客户的成本可能非常高,因此会希望能够确保现有客户有重复购买。在间隔一个、两个、三个、N 个季度重复购买的客户数目是多少? 从未重复购买的客户数目是多少? 如果按季度阵列划分重复购买行为,会有什么发现么?

    客户订单频率
    新客户增长情况
    同期群分析 各地区客户争取率 回头客分析

    我们在使用 LOD 的时候,还会跟参数进行结合。比如,下图展示的是每个地区的销售情况,同时有一个参照地区,每一个地区都会跟参照地区做比较,然后可以进行一个切换。我们在计算里面有时候可以融入参数。


    如何正确进行计算

    或许你还不知道该根据哪些应用场景选择计算类型,我们在这里分享一种思维方法,方便各位更好做出决策。

    首先我们看计算是否会需要排名迭代或者移动,跨行计算这种,如果要存在这种计算的时候,你就要用表计算,因为这些计算相当于存在一个跨行,你要跨行只有表计算能去实现跨行的结果。

    如果你不是做这类计算,我们可以做其它的判断。你的视图里面是否有所需的所有数据,如果是,则可进入下一问题。视图布局是否允许使用快速表计算,因为有的时候视图布局是不允许用快速表计算的,如果是允许可以使用快速表计算,相当于做一个二次计算。

    如果是不允许,以及包括视图没有所需数据的时候,就可以统一去看另外一个问题,我们的数据粒度是否一致,如果我们的数据粒度是一致,可以直接使用基本计算,如果数据力度是不一致,就需要用到详细级别表达式。


    文章部分信息来源于网络,如有侵权请告知

    相关文章

      网友评论

        本文标题:优阅达“优分享”| 2018 Tableau 峰会『干货帖』:通

        本文链接:https://www.haomeiwen.com/subject/rugtgftx.html