美文网首页数据库
数据仓库工具箱——库存模型

数据仓库工具箱——库存模型

作者: 熊猫学猿 | 来源:发表于2022-06-17 06:02 被阅读0次

规范化的维度表被称为雪花模型。我们建议抵制采用雪花模式的冲动。主要出于设计动机:易用性和性能。

众多的雪花模式要构成一个复杂的结果。业务用户不可避免的要与复杂性抗争,简单化是维度建模的主要目标之一。

大量的表和连接操作通常导致缓慢的查询性能。连接结果定义的复杂性增加了优化器选择错误策略的可能性。

雪花模型对用户浏览维度的能力具有负面影响。浏览通常包含约束一个或多个维度属性,并寻找其他属性基于约束属性的不同值

固定深度层次在维度表中应该被扁平化

蜈蚣事实表包含太多纬度表的事实表设计,无法实现对多部分构成的键构建有效的索引。大量的连接无论是对可用性还是对性能来说都是一个问题。

多数业务过程可以用不超过20个维度的事实表表示。如果某个设计有25个或更多维度,应该考虑采取措施合并关联的维度。具有良好关联的属性。 大量的纬度通常表明某些维度不是完全独立的,应该合并为一个纬度。将同一层次的元素表示为事实表中不同维度,是维度建模常见的错误。

库存将产生稠密的快照表。在每个商店,每个产品,每天都会有一行。6000种 产品储存在100个商店中差不多有将近600万行将在夜间被插入的事实表中,由宇行宽度仅仅只有14个字节,所以每次加载事实表时仅增长84M。

库存水平对日期来说是非可加的。因为他们表示水平或某个时间点均衡情况的快照。由于库存水平对某些维度来说是可加的,但不是所有维度,我们将其称为半可加事实。

记录静态水平(库存水平,金融账户余额以及密度度量如房间温度)的所有度量针对日期纬度以及其他可能纬度天然具有非可加性。在此情况下,度量可以跨日期按照时间周期数求平均聚集。

对多数库存分析来说,仅有现存数量是不够充分的。现存数量需要与其他事实协同以度量库存运动变化的情况。例如流转数量及日供货数量等

每个库存事务确定日期、产品、仓库、供应商、事务类型。多数情况下,简单的额度表示被事务影响的库存数量。包含了反应每个库存操作的详细信息。事务事实表可方便地度量频繁发生的特定时间事务类型,用于回答那些周期快照由于粒度问题而不能回答的问题

记住生活中不单单只有事务,某些形式的快照表能够给出更多重要的过程视图,通常可以作为事务事实表的补充

相关文章

  • 数据仓库工具箱——库存模型

    规范化的维度表被称为雪花模型。我们建议抵制采用雪花模式的冲动。主要出于设计动机:易用性和性能。 众多的雪花模式要构...

  • 数据仓库生命周期工具箱

    数据仓库生命周期工具箱

  • 数据分析 2017-02-04

    Inmon 《构建数据仓库》《DW 2.0》Kimball 《数据仓库生命周期工具箱》Inmon偏向于从底层的数据...

  • 数据仓库

    《数据仓库工具箱 维度建模权威指南 第3版.pdf》

  • 每天一句话-数仓书籍

    关于数据仓库的书籍,推荐一本那就是 《数据仓库工具箱:维度建模的完全指南》,但这本书的中文翻译,真的是烂

  • 数据仓库工具箱

    数据仓库与Kimball维度建模概览 操作型系统与数据仓库 操作型系统:保存、更新、删除数据一般一次处理一个事物不...

  • 数据仓库工具箱—会计

    分类帐纬度是一种方便直观的维度,可以将多个分类放入同一个事实表中,访问这一事实表的查询必须以单一值约束分类账维度(...

  • 数据仓库工具箱—ETL

    ETL(Extract Transformation Load)获取、转换、加载 ETL系统结构的建立始于处理一个...

  • WMS库存模型设计

    目的 设计一种能够满足大部分WMS业务的库存模型,支持多批次管理。注意:此库存模型不包含SN设计 思路 将库存结构...

  • 数据仓库工具箱—杂项维度

    在建模复杂的操作型源数据时,通常会遭遇大量五花八门的指标和标志。它们包含小范围的离散值,处理这些较低粒度的标志和指...

网友评论

    本文标题:数据仓库工具箱——库存模型

    本文链接:https://www.haomeiwen.com/subject/buecvrtx.html