0x00 前言 本文将会谈一谈在数据仓库中拉链表相关的内容,包括它的原理、设计、以及在我们大数据场景下的实现方式。...[作者空间]
一:多维分组聚合背景 企业针对有些指标,希望能够支撑上钻和下钻来进行查看,这样即可以满足精细化分析,又可以满足指标...[作者空间]
一:自定义UDF函数 UDF函数的特点是:多参数/单参数-》单个返回值,并且多个参数是一行当中的数据,不能实现跨行...[作者空间]
Hive是基于Hadoop的一个数据仓库系统,在各大公司都有广泛的应用。美团数据仓库也是基于Hive搭建,每天执行...[作者空间]
一:hive引入静态分区的意义 目前主流离线数据仓库都在使用hive,最初由谷歌工程师开发,后面贡献给apache...[作者空间]