维度建模数仓领域中的事实表大致分以下三种: a. 事务事实表b. 周期快照事实表c. 累计快照事实表 一、事务事实...[作者空间]
缓慢变化维(Slowly Changing Dimension)就是变化相对缓慢(相对与快速变化的事实表来说)的维...[作者空间]
1、lag() over() lag(pay_succ_time, 1, '1990-01-01 00:00:00...[作者空间]
HDFS体系结构 HDFS采用了主从(Master/Slave)结构模型,一个HDFS集群是由一个NameNode...[作者空间]
HDFS非常容易存储大数据文件,如果Hive中存在过多的小文件会给namecode带来巨大的性能压力。同时小文件过...[作者空间]
举个栗子 a b 1a b 2a b 3c...[作者空间]
一、Map倾斜 根本原因:读入的文件块的数据分布不均匀。 1、上游表文件的大小不均匀,并且小文件特别多,导致当前表...[作者空间]
什么是数据仓库? 面向主题的,集成的,相对稳定的,反映历史变化的数据集合,用于支持管理决策。 数据仓库,英文名称D...[作者空间]