Hive函数 - cube, rollup 详解

作者: Paycation | 来源:发表于2019-04-05 17:09 被阅读0次

Hive函数 - cube, rollup 详解
Hive Grouping Sets多维分析
Hive中with cube、with rollup、group
hive之with cube、with rollup、group
Hive分析窗口函数(五)grouping sets,cube,
HQL聚集计算之进阶篇
Kylin定时增量build
rollup and cube group by
Oracle分组函数之ROLLUP用法
Hive 多分组函数GROUPING SETS,GROUPING

使用场景

很多时候我们除了需要在报表中罗列出每个具体项的数据，还需要进行汇总，并且是不同维度的汇总。如果在展示表格的时候汇总，可能会比较慢，我们一般是把结果计算出来之后，以'ALL'或者'总计','汇总'等字样作为项的名称，然后放入汇总值。如果仅仅是所有行的汇总，一次聚合就搞定。但是不同维度的汇总就会很麻烦，所幸我们有 cube, rollup 函数。

tips：可能有人不懂什么是不同维度的聚合。比如下表：

国籍	性别	人数
中国	男	80
中国	女	70
美国	男	50
美国	女	44
中国	合计	150
美国	合计	94
合计	合计	244

这里展示了每个项的数据，以及从右到左不同维度的合计（性别维度, 所有维度），相当于后面说的 rollup 函数。
如果进一步得到所有组合的合计，那么上表还需要附加下面的内容：

国籍	性别	人数
合计	男	130
合计	女	114

增加了国籍维度的聚合。把所有维度进行进行组合聚合，这就是 cube 函数的作用。

PS：其实这里国籍和性别应该同时聚合一次，不够由于没有国籍、性别同时相等的行，也就没有聚合的必要，但是数据库在计算时，这一步不会省略。

cube 函数

先看代码：

select 
    if(grouping(a)=1, 'ALL', a) a,
    if(grouping(b)=1, 'ALL', b) b,
    count(1)
from my_table
group by
    cube(a, b)

上面的代码相当于：

select 'ALL' a, 'ALL' b, count(1) from my_table # 整体进行聚合
union all
select a, 'ALL' b, count(1) from my_table group by a # a 为维度聚合
union all
select 'ALL' a, b, count(1) from my_table group by b # b 为维度聚合
union all
select a, b, count(1) from my_table group by a, b # a, b 两个维度聚合

tips:

grouping(a)=1 表示当不是以 a 为维度聚合的时候，也就是 a 会被合并的时候，返回 true。此时用一个值来填充 a，默认是 NULL，这里我们用了更有意义的 "ALL" 字符串。
当要聚合的维度很多时，用 cube 的计算量会非常大。聚合次数指数级增长。所以不要在 cube 里放太多字段。

rollup 函数

select 
    if(grouping(a)=1, 'ALL', a) a,
    if(grouping(b)=1, 'ALL', b) b,
    count(1)
from my_table
group by
    rollup(a, b)

等价于：

select 'ALL' a, 'ALL' b, count(1) from my_table # 整体进行聚合
union all
select a, 'ALL' b, count(1) from my_table group by a # a 为维度聚合
union all
select a, b, count(1) from my_table group by a, b # a, b 两个维度聚合

和 cube 函数的区别是，cube 会把括号里面的所有字段进行组合，而 rollup 只会“递进”地聚合括号里的字段。

网友评论

本文标题：Hive函数 - cube, rollup 详解

本文链接：https://www.haomeiwen.com/subject/lvjqiqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Hive函数 - cube, rollup 详解

使用场景

cube 函数

rollup 函数

相关文章

Hive函数 - cube, rollup 详解

Hive Grouping Sets多维分析

Hive中with cube、with rollup、group

hive之with cube、with rollup、group

Hive分析窗口函数(五)grouping sets,cube,

HQL聚集计算之进阶篇

Kylin定时增量build

rollup and cube group by

Oracle分组函数之ROLLUP用法

Hive 多分组函数GROUPING SETS,GROUPING

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读