DAX学习笔记

作者: 35212c1e23f9 | 来源:发表于2018-11-24 10:31 被阅读0次

    一、什么是DAX

    DAX是SSAS(sql server as service)和power pivot for excel的编程语言,于2010年发布。

    DAX被设计用于计算基于数据模型的业务函数。

    二、DAX与SQL的差别

    1)SQL中表之间尽管定义了主外键关系,但是查询时必须显式指定join关系。

          DAX则不需要指定,表之间的关系是DAX数据模型的一部分,并且这个关系只能是left outer join.

         例如:select Customers.CustomerName,sum(Sales.SalesAmount) as SumOfSales

                    from sales inner join on Sales.CustomerKey = Customers.CustomerKey

                    group by Customers.CusTomerName

          等价的DAX:

                    ECALUATE

                    SUMMARIZE(

                             Sales,                 

                             Customers[CustomerName],

                             ”SumOfSales”,

                             SUM(Sales[SalesAmount])

                     )

     2) SQL是一种声明式语言,你只需要声明需要什么样的数据集合,而不需要关心引擎是如何获取这些数据。

         DAX是一种函数语言。DAX的所有表达式都是函数调用,一个函数的参数也可以是另外一个函数调用。

         在SQL中的WHERE对应DAX中的FILTER函数,二者功能类似。(DAX的抽象层次更低一些,更贴近计算过程。)

                 例如:

                  select Customers.CustomerName,sum(Sales.SalesAmount) as SumOfSales

                    from sales inner join on Sales.CustomerKey = Customers.CustomerKey

                   where Customers.Continent = ‘Europe' 

                   group by Customers.CusTomerName

                 等价的DAX:

                  ECALUATE

                    SUMMARIZE(

                             FILTER(Customers,Customers[Continent] = “Europe"), 

                             Customers[CustomerName],

                           ”SumOfSales”,

                            SUM(Sales[SalesAmount])

                     )

     3)SQL语言中,对查询语言和编程语言有清晰的区分。例如存储过程就是作为基于SQL的一种编程语言。但是DAX并不区分编程语言和查询语言,它只是一个丰富的函数集合,操作物理表然后输出物理表。因此DAX比SQL要更简单一些。

    4)SQL中的子查询是一种非常强大的功能,DAX也有类似机制,而且比SQL表达跟自然和简洁。

          例如:

                 select * from

                    (

                   select Customers.CustomerName,sum(Sales.SalesAmount) as SumOfSales

                    from sales inner join on Sales.CustomerKey = Customers.CustomerKey

                   where Customers.Continent = ‘Europe' 

                   group by Customers.CusTomerName

                    )

                  where SumOfSales > 100

          等价的DAX:

                  EVALULATE

                  FILTER(

                    SUMMARIZE(

                             FILTER(Customers,Customers[Continent] = “Europe"), 

                             Customers[CustomerName],

                           ”SumOfSales”,

                            SUM(Sales[SalesAmount])

                     ),

                     [SumOfSales] > 100

                 )

    三、DAX基本语法

    3.1 DAX的数据类型:

    实际开发中,可能并不需要太关注这些类型,因为DAX支持隐式转换,而且比一般的SQL隐式转换强大。例如 Sales[Order Date]+7  这种在SQL中是一定要用函数实现的,但是DAX可以识别为是Order Date字段日期往后加7天。

        例1:  = 5 & 4

        例2:  = ”5“ + ”4“

    虽然DAX的隐式转换很强大,但是跟SQL一样,通常不建议在可以明确的场景下依赖隐式转换,因为可能会导致不符合预期的转换错误。

    3.2 DAX的操作符

    3.3 计算字段与度量

    在DAX中,计算字段是一个字段表达式,表达单行计算的语义。而度量也是一个字段表达式,但是表达的是行间汇总计算的语义。

         例1: sales[SalesAmount] - sales[TotalProductCost]  是一个计算字段

         例2: sum(sales[SalesAmount]) - sum(sales[TotalProductCost] ) 是一个度量

    四、DAX常用函数

    函数分类:

    五、DAX表达式

    DAX的表达式分为两类:scalar expression 和 table expression

    所谓scalar expression, 一般只返回一个String或number类型的单值。

     例如: = 4+3   

                 = sum(Sales[Quantity])

                 = countrows(Filter(sales,sales[unit price]))

    而table expression则输出的是一个二维表。

     例如: = Filter(sales,sales[unit price])

    DAX的语法全集是

    [ DEFINE { MEASURE <tableName>[<name>] = <expression>} ]

    EVALUATE <table> 

    [ ORDER BY { <expression> [ { ASC | DESC } ] } [ , …]  

         [START AT {<value>|<parameter>} [,…]]

    ]

    六、计算上下文

    filter context: 可以理解为是一组表,每张表只有一列,该列包含该列可以显示的值。

    一个filter是某一列上的一组值。

    一个filter总是只作用于单一列。

    七、常用函数

    values : 

    [NumOfCustomers] = COUNTROWS( VALUES( Sales[CustomerKey] ) )

    HASONEVALUE :

    检测是否表达式只返回一个值

    例:[ScaledSalesAmount] := IF ( HASONEVALUE ( Scala[ DivideBy] ),

                                                            DIVIDE ( [ Sales Amount ] , VALUES ( Scale[ DivideBy ] )),

                                                            [ Sales Amount ]

                                                          )

    CALCULATE:

    [ Measure ] := CALCULATE ( Expression, Condition1 , Condition2 ,…)

    本函数是唯一可以修改filter context的函数。

    它接收两类条件输入,一类是值列表(table expression),一类是布尔表达式。

    实际上第二类也会被转化为第一类。

    例如:

    会被转化为:

    案例:

    目标表格

    错误的写法和结果:

    正确的写法:

    案例2:

    结果:

    如果Filter中加ALL,是不是跟CALCULATE表达式等价呢?

    结果是:

    并不等价,因为ALL会把外部的所有列的过滤条件都清除了。

    这就需要另外一个函数,CALCULATETABLE。

    CALCULATETABLE与CALCULATE的差别在于返回值,前者返回table,后者返回单元格。

    结果是:

    简化的写法:

    CALCULATE函数的Context转换

    我们知道CALCULATE函数可以接收外部的row context,这是一个非常有用的特性。例如:

    可以看到CALCULATE函数过滤了Product name,而单纯的sum函数始终输出的是总和。

    原理是,CALCULATE函数可以把外部的row context转化为等价的filter context,然后作用于内部计算。

    如果是measure则计算时会自动加上CALCULATE,行为跟显式加CALCULATE是一致的。

    例如下面两种写法是等价的:

    相关文章

      网友评论

        本文标题:DAX学习笔记

        本文链接:https://www.haomeiwen.com/subject/qneeqqtx.html