美文网首页
数仓模型的常见问题

数仓模型的常见问题

作者: 傻疯子 | 来源:发表于2021-12-26 23:35 被阅读0次

数仓建设的模型主要可以归为三类问题,完善性、可复用性、规范性。

完善性主要是指数仓建设是否完善,是不是有跨层引用的情况。比如dws或者app层直接引用ods层数据,而不是dwd层数据;或者说dws和app是否建设完善,能否通过dws和app直接把结果查询出来。

可以通过统计ods层中被跨层引用的比率,以及汇总表占所有查询的比率,可以分别感知这两个问题。

可复用性是指模型被下游引用的情况,最差情况是只被使用了一次,而引用次数越多复用性越好,说明价值可能越高。

可以通过统计每张表被引用的情况,然后通过统计某一个分层的平均引用情况或者分布来得知总体复用情况。

规范性是指表是否进行了分层和主体域的划分,然后这个表明是否说明了表的划分和业务过程以及表的数据存储情况,然后表的字段在不同的表中是否做了统一。

通过统计表的归属情况以及表名的规范程度来得知初步情况。

相关文章

  • 数仓模型的常见问题

    数仓建设的模型主要可以归为三类问题,完善性、可复用性、规范性。 完善性主要是指数仓建设是否完善,是不是有跨层引用的...

  • 数仓建设规范

    本文将全面讲解数仓建设规范,从数据模型规范,到数仓公共规范,数仓各层规范,最后到数仓命名规范,包括表命名,指标字段...

  • 数仓模型设计详细讲解

    前言 今天给大家分享下数仓中的模型设计,一个好的数仓项目首先看一下它的架构以及他所用到的模型,它们使用的模型也都...

  • 数仓模型建设

    为了防止数仓模型的混乱建设需要通过一些约定和规范进行建设。 建设要求 1.统一ods层的建设,一次数据只接入一次,...

  • 【知识】可实操使用的数仓建设规范指南

    目录: 一、数据模型架构原则数仓分层原则主题域划分原则数据模型设计原则 二、数仓公共开发规范层次调用规范数据类型规...

  • 基于Apache doris怎么构建数据中台(八)-数仓管理

    数仓分层模型 数仓分层模型的好处: 1、数据结构化更清晰:每一个数据分层都有它的作用域和职责,在使用表的时候能更方...

  • 数仓建设二期规划大纲

    数仓一期建设并上线一段时间,领导安排我考虑一下数仓二期的建设。 一期简介 一期是按照标准数仓模型建设的,主要包括原...

  • 数仓--Theory--数仓的数据模型详解

    什么是数据模型 数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间联系的形式,来表示现实世界中...

  • 数仓模型之 拉链表

    Q1 什么拉链表? 拉链表,记录每条信息的生命周期,一旦一条记录的生命周期结束,就要重新开始一条新的记录,并把当前...

  • 如何评价数仓模型的质量

    参考文章:数据模型无法复用,归根结底还是设计问题[https://www.geekgay.com/class-1-...

网友评论

      本文标题:数仓模型的常见问题

      本文链接:https://www.haomeiwen.com/subject/scpeqrtx.html