美文网首页
数据仓库工具箱—处理维度变换

数据仓库工具箱—处理维度变换

作者: 熊猫学猿 | 来源:发表于2022-06-22 18:49 被阅读0次

首先,确定采购是建模的业务过程,采购事务包括采购请求、采购订单,托运通知、发票和付款等

多个采购事务来自不同的源系统。购买系统负责提供购买需求和购买订单。仓库系统,负责提供发货通知和仓库清单,账户支付系统负责处理供应商付款。

是否应该建立一个包含用于观察所有采购食务的类型纬度的混合事务事实表,或者为每个事务类型建立不同的事实表。这个问题是设计上的一个两难问题,存在于很多事务环境中,不仅仅出现在采购款事务环境中。作为维度建模者,需要基于对业务需求的全面理解,并权衡源数据的现实情况,制定设计决策。

除了需要考虑多个采购事务事实表的决策外,还需要开发快照事实表,以全面解决业务需求。

累积快照是指应定义良好的里程碑建模的过程,如果过程不断持续,始终不会结束,采用累积快照并不是一个好的选择。

对每个维度表的属性,都需要考虑为其定义处理变化的策略。

类型0:保留原始值

类型1:重写:对其响应需要重写维度行中的旧值,以当前值替换,属性始终反映最近的情况。

类型2:增加新行

类型3:增加新属性

类型4:增加微型维度

类型5:微型维度与类型1支架表

类型6:将类型1属性增加的类型2维度。

订单管理。

订单事务事实表比较自然的粒度是每行表示每个订单的每个列表明细。

产品纬度是最常见最重要的纬度表之一。

大多数产品纬度都具有以下共同特征

大量冗长的、描述性的列

一个或多个属性层次,加上没有层次的属性

重新建立操作型产品代码到代理键的映射

增加描述性属性值以扩大或替换操作型代码

检查属性值,确保没有拼写错误,不可能存在的值、多变量等

将属性定义、解释、元数据来源文档化

客户维度为每个发送产品的不同地址建立一行客户维度按照不同的业务特性来划分,可能是中等程度大小或超大型

客户维度经常存在一个不同的层次。客户维度中另一个潜在的层次是制造商销售组织。是否应该被建模为不同的维度,或者增加到客户维度中去。如果销售代理与客户以一对一或多对多关系高度相关,则将销售组织属性与客户属性合并到一个维度中是一种可行的方法

当实体之间存在固定的、不随时间变化的、强关联的关系时,它们应该被建模到单一维度中

退化维度通常被保留作为操作型事务的标识符

相关文章

  • 数据仓库工具箱—处理维度变换

    首先,确定采购是建模的业务过程,采购事务包括采购请求、采购订单,托运通知、发票和付款等 多个采购事务来自不同的源系...

  • 数据仓库

    《数据仓库工具箱 维度建模权威指南 第3版.pdf》

  • 每天一句话-数仓书籍

    关于数据仓库的书籍,推荐一本那就是 《数据仓库工具箱:维度建模的完全指南》,但这本书的中文翻译,真的是烂

  • 数据仓库生命周期工具箱

    数据仓库生命周期工具箱

  • 离线数仓二

    数据仓库维度模型设计 维度建模基本概念 维度模型是数据仓库领域大师Ralph Kimall所倡导,他的《数据仓库工...

  • 数据仓库工具箱—杂项维度

    在建模复杂的操作型源数据时,通常会遭遇大量五花八门的指标和标志。它们包含小范围的离散值,处理这些较低粒度的标志和指...

  • 数据仓库工具箱

    数据仓库与Kimball维度建模概览 操作型系统与数据仓库 操作型系统:保存、更新、删除数据一般一次处理一个事物不...

  • 数据分析 2017-02-04

    Inmon 《构建数据仓库》《DW 2.0》Kimball 《数据仓库生命周期工具箱》Inmon偏向于从底层的数据...

  • Dimension table & Fact Table

    Dimension table 维度表是数据仓库星型模式中的一张表。数据仓库是使用由事实和维度表组成的维度数据模型...

  • 数据仓库(09)数仓缓慢变化维度数据的处理

      数据仓库的重要特点之一是反映历史变化,所以如何处理维度的变化是维度设计的重要工作之一。缓慢变化维的提出是因为在...

网友评论

      本文标题:数据仓库工具箱—处理维度变换

      本文链接:https://www.haomeiwen.com/subject/kbwjvrtx.html