美文网首页数据库
数据仓库工具箱——库存模型

数据仓库工具箱——库存模型

作者: 熊猫学猿 | 来源:发表于2022-06-17 06:02 被阅读0次

    规范化的维度表被称为雪花模型。我们建议抵制采用雪花模式的冲动。主要出于设计动机:易用性和性能。

    众多的雪花模式要构成一个复杂的结果。业务用户不可避免的要与复杂性抗争,简单化是维度建模的主要目标之一。

    大量的表和连接操作通常导致缓慢的查询性能。连接结果定义的复杂性增加了优化器选择错误策略的可能性。

    雪花模型对用户浏览维度的能力具有负面影响。浏览通常包含约束一个或多个维度属性,并寻找其他属性基于约束属性的不同值

    固定深度层次在维度表中应该被扁平化

    蜈蚣事实表包含太多纬度表的事实表设计,无法实现对多部分构成的键构建有效的索引。大量的连接无论是对可用性还是对性能来说都是一个问题。

    多数业务过程可以用不超过20个维度的事实表表示。如果某个设计有25个或更多维度,应该考虑采取措施合并关联的维度。具有良好关联的属性。 大量的纬度通常表明某些维度不是完全独立的,应该合并为一个纬度。将同一层次的元素表示为事实表中不同维度,是维度建模常见的错误。

    库存将产生稠密的快照表。在每个商店,每个产品,每天都会有一行。6000种 产品储存在100个商店中差不多有将近600万行将在夜间被插入的事实表中,由宇行宽度仅仅只有14个字节,所以每次加载事实表时仅增长84M。

    库存水平对日期来说是非可加的。因为他们表示水平或某个时间点均衡情况的快照。由于库存水平对某些维度来说是可加的,但不是所有维度,我们将其称为半可加事实。

    记录静态水平(库存水平,金融账户余额以及密度度量如房间温度)的所有度量针对日期纬度以及其他可能纬度天然具有非可加性。在此情况下,度量可以跨日期按照时间周期数求平均聚集。

    对多数库存分析来说,仅有现存数量是不够充分的。现存数量需要与其他事实协同以度量库存运动变化的情况。例如流转数量及日供货数量等

    每个库存事务确定日期、产品、仓库、供应商、事务类型。多数情况下,简单的额度表示被事务影响的库存数量。包含了反应每个库存操作的详细信息。事务事实表可方便地度量频繁发生的特定时间事务类型,用于回答那些周期快照由于粒度问题而不能回答的问题

    记住生活中不单单只有事务,某些形式的快照表能够给出更多重要的过程视图,通常可以作为事务事实表的补充

    相关文章

      网友评论

        本文标题:数据仓库工具箱——库存模型

        本文链接:https://www.haomeiwen.com/subject/buecvrtx.html