数仓中的全量表、快照表、增量表以及拉链表

数仓中的全量表、快照表、增量表以及拉链表

作者: 喝奶茶不加奶茶 | 来源:发表于2020-08-19 11:27 被阅读0次

数仓中的全量表，增量表，拉链表，流水表，快照表
数仓中的全量表、快照表、增量表以及拉链表
什么是增量表，全量表，快照表
MaxCompute full outer join改写left
全量表、快照表、增量表、拉链表、维度表、实体表、事实表
没准备好也能出发 day
妇科肿瘤与静脉血栓
Robot Framework 变量
i++,++i和i--
日常问题1

（一）一些基础概念：

存量：系统在某一时点的存有的数量。
本期期末存量=上期期末存量+本期内增量
流量：在某一段时间内流入\流出系统的数量。
增量：在某一段时间内系统中存有数量的变化。
增量=流入量-流出量

（二）四类表

一、全量表

全量表没有分区，表中的数据是前一天的所有数据。
比如今天是19号，那么全量表里面的就是18号的数据。
每次往全量表里面写数据都会覆盖之前的数据，所以全量表不能记录历史的数据情况，只有截止到当前最新的、全量的数据。
有无变化，都要报；每次上报的数据都是所有的数据（变化的+没有变化的）

二、快照表

快照表是有时间分区的，每个分区里面的数据都是分区时间对应的前一天的所有全量数据。
比如当前数据表有3个分区，24号、25号、26号，其中，24号分区里面的数据就是从历史到23号的所有数据;25号分区里面的数据就是从历史到24号的所有数据，以此类推。
缺点：
这种存储方法导致每个分区都存储了许多重复的数据，尤其在数据量大的时候，就会非常的浪费存储空间。

于是引出了拉链表，但先了解一下增量表。

三、增量表

记录每天新增数据的表，比如，从24号到25号新增了哪些数据，改变了哪些数据，这些都会存储在增量表的25号分区里面。
上面说的快照表的25号分区和24号分区（都是t+1,实际时间分别对应26号和25号），它俩的数据相减就是实际时间25号到26号有变化的、增加的数据，也就相当于增量表里面的25号分区的数据。
只报变化量，没有变化不用报（只有上报时间，开始时间更改为上报时间）。

四、拉链表

它是一种维护历史状态，以及最新状态数据的一种表。
是分区表，有些不变的数据或者是已经达到状态终点的数据就把它放在分区里面，分区字段一般为开始时间：start_date和结束时间:end_date。
一般在该天有效的数据，它的end_date是大于等于该天的日期的。
获取某一天全量的数据，可以通过表中的start_date和end_date来做筛选，选出固定某一天的数据。
举例：如果想取截止到20200819的全量数据，其where过滤条件就是
where start_date<='20200819' and end_date>=20200819
封链时间可以是2999，9999等比较大的年份；
拉链表到期数据要报0；
拉链表和增量表的共同点：表结构基本一样。

补充：

存量是在某一时刻的总量，存量一般设计成拉链表（月报（常用）；日报）
流量和存量的区别：流量是增量；存量是总量。

四种表
 hive数据库设计中的拉链表、增量表、全量表（有图示）

相关文章

数仓中的全量表，增量表，拉链表，流水表，快照表
[数仓中的全量表，增量表，拉链表，流水表，快照表] 预热：我们先从几个物理概念入手理解什么是流量，存量，增量（...
数仓中的全量表、快照表、增量表以及拉链表
（一）一些基础概念：存量：系统在某一时点的存有的数量。本期期末存量=上期期末存量+本期内增量流量：在某一段时间...
什么是增量表，全量表，快照表
按照每天存放的数据以及是否按天分区可以分为增量表，全量表和快照表
MaxCompute full outer join改写left
简介：ods层数据同步时经常会遇到增全量合并的模型，即T-1天增量表 + T-2全量表 = T-1全量表。可以通过...
全量表、快照表、增量表、拉链表、维度表、实体表、事实表
原文链接： https://blog.csdn.net/a6822342/article/details/1000...
没准备好也能出发 day
我们即将开始一次全航线有表由表及里的查看自己的状态以及关系模式。在公益营中所使用的量表，都是国际通用的专业量表，...
妇科肿瘤与静脉血栓
一、基本概念二、评估及预防 1）VTE风险评估 -- Khorana（霍拉纳）量表Khorana量表.jpg 2...
Robot Framework 变量
变量表中声明变量在测试套件文件中声明变量表 Variables，在变量表中声明该测试套件中用到的变量。在测试套...
i++,++i和i--
对于i=i++ 赋值运算最后算，先算i++将1压入操作数栈，将i压入局部变量表将i自增，局部变量表中i=2再...
日常问题1
[2017.05.20]业务流：量表-添加量表（从系统库中进行添加，addTFromBase.php），查看量表（...

网友评论

zhaoyqiu的数据分析进阶之路2.0

本文标题：数仓中的全量表、快照表、增量表以及拉链表

本文链接：https://www.haomeiwen.com/subject/lxmbrktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

zhaoyqiu的数据分析进阶之路2.0

热点阅读

zhaoyqiu的数据分析进阶之路2.0

关于我们|服务条款|联系我们|数仓中的全量表、快照表、增量表以及拉链表|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！