美文网首页Power BI
DAX从入门到精通 3-6-1 了解values和distinc

DAX从入门到精通 3-6-1 了解values和distinc

作者: PowerBI入门到实践 | 来源:发表于2019-06-30 22:05 被阅读0次

    了解values和distinct

    之前的章节,我们学习了all引用一个列的时候,返回包含该列唯一值的表。DAX还另外提供了两个函数,它们也是返回列的唯一值,values和distinct。
    在evaluate中,如果没有使用其他筛选条件,values和distinct看起来效果和all一样。但是,当你把它们使用到DAX度量值的时候,你会观察到它们之间一些不同点,因为透视表会提供不同的筛选条件。看下下面的度量值,它们都是计算brand和size列的唯一值。

    [Products] := COUNTROWS ( Product )
    [Values Brands] := COUNTROWS ( VALUES ( Product[Brand] ) )
    [Distinct Brands] := COUNTROWS ( DISTINCT ( Product[Brand] ) )
    [Values Sizes] := COUNTROWS ( VALUES ( Product[Size] ) )
    [Distinct Sizes] := COUNTROWS ( DISTINCT ( Product[Size] ) )
    

    values()返回所有可见的唯一值,包括了blank。而distinct也是返回唯一值,但是对不匹配的blank值进行了排除。但是如果blank已经包含在自身的列中了,那么结果也会包含blank。所以两者的区别就是blank是否作为了关系的条件。
    举个例子来看会更容易理解这个区别,数据按照product的class进行分类,每个类目有不同的产品数。例如Deluxe有360个产品,有11种bland,204种size。values和distinct只有在blank的位置上,存在数字差异。表格也提供了sales amount在检测这个不匹配的产品。


    image.png

    另外一个区别是总计行,brand中,values比distinct多了1.而size,两个函数返回的是相同的数字,原因是size列包含了一个blank,所以这个blank产品没有添加一个新的数字到disinct size列。
    当没有筛选条件的时候,distinct相当于allnoblankrow,values相当于all。
    values也可以把表作为参数。这情况下,它返回表的左右可见单元格,也包含了空行。例如下面例子,在模型中,sales表和product表存在通过productkey的关系,但是存在无法匹配的product。

    [Products] := COUNTROWS ( Product )
    [Values Products] := COUNTROWS ( VALUES ( Product ) )
    [All NoBlank Products] := COUNTROWS ( ALLNOBLANKROW ( Product
    ) )
    [All Products] := COUNTROWS ( ALL ( Product ) )
    
    image.png

    这个表可以看出来,当没有筛选条件的时候,values和all结果一样,包含了blank行,显示了没有匹配的行的在Sales Amount。这时候,不能使用distinct。如果有重复行,你没有一种单一的DAX函数来去重重复行(事实上要使用summarize来代替,后面的章节会用到)。另外,度量值product忽略空行,返回了当前表的总行数,结果和allnoblankrow一样。

    values函数用于值函数

    虽然values是表函数,但是我们通常也可以将它作为值函数来使用,这个是因为DAX有个特性,这小节我们来学习。例如,values按如下表达式使用,当选择的某部分product都是相同的颜色时候,它返回该颜色。

    [Color Name] :=
    IF (
    COUNTROWS ( VALUES ( Product[Color] ) ) = 1,
    VALUES ( Product[Color] )
    )
    

    通过图示可以看到,当color name列包含空行的时候,它意味着有两种或者以上的不同颜色。


    image.png

    这里有趣的地方是,我们使用values函数作为值函数,虽然它本身返回的是一个表。不仅是values()函数有这样的特点,这个也适用于大部分DAX函数。
    如果一个表达式返回的表只有一行一列,那么如果需要的话,系统就会自动的将其转换为一个值。
    实际操作中,如果返回的表是一行一列,那么就可以把该表表达式用作值表达式。但是如果返回的表有多行,那么会报一个错误:A table of multiple values was supplied where a single value was expected。所以,你必须要保证,你表达式的结果只能返回一行一列。
    Color Name使用了countrows来检测返回的结果是否只有一行,另外一种方法是使用hasonevalue()函数,它同样是检测返回的行数,如果只有返回一行,那么结果是true。下面两个语句有相同的结果:

    COUNTROWS ( VALUES ( <column> ) ) = 1
    HASONEVALUE ( <column> )
    

    相比countrows,你更应该使用hasonevalue来,首先,它的可读性更好,另外运行速度也更快。下面这样的写法就是基于hasonevalue:

    [Color Name] :=
    IF (
    HASONEVALUE ( Product[Color] ),
    VALUES ( Product[Color] )
    )
    

    通常是使用values表达式作为值函数是因为,它总是返回一个列以及可能是多个行,这个行数取决于执行的内容。values的使用在很多情况下都会有使用,本书后面会多次采用这样的方法

    相关文章

      网友评论

        本文标题:DAX从入门到精通 3-6-1 了解values和distinc

        本文链接:https://www.haomeiwen.com/subject/bgricctx.html