美文网首页数据仓库
数据仓库建模——维度建模

数据仓库建模——维度建模

作者: Q以梦为马 | 来源:发表于2020-09-03 14:03 被阅读0次

数据仓库的建模方法有很多种,常见的有维度建模法、范式建模法、实体建模法等,下面主要介绍一下维度建模法。

维度建模的基本概念

维度建模(dimensional modeling)是专门用于分析型数据库、数据仓库、数据集市建模的方法。它本身属于一种关系建模方法,但和关系建模方法相比增加了两个概念:

维度表(dimension)

表示对分析主题所属类型的描述。比如"昨天下午郑州外国语学校8年级3班王小明同学花费了99元购买了一套课程"。那么我们以购买为主题进行分析,可从这段信息中提取三个维度:时间维度(昨天下午),地点维度(郑州外国语学校), 商品维度(课程)。通常来说维度表信息比较固定,且数据量小。

  • 维度表类型
    • 日期维
      • 数据仓库必须有的维度,包含日期,日期所属的周,月,季度,年等信息。
    • 角色维
      • 相同的维度表在维度模型中扮演不中的逻辑角色,一般通过创建视图来表示。
    • 支架维
      • 如果维度之间是一对多的关系或区别于原维度的多个描述性维度属性,可以建雪花型支架维度。
    • 多值维度桥接维
      • 如果二个维度表是多对多的关系,可以使用多值维度设计。
    • 微型维
      • 一个大型维有些属性变化比较频繁,把这些属性单独生成一个微型维度表。
    • 缩小维
      • 维度表的一个子集或部分属性。
    • 层次维
      • 有些维度表是有层次结构的,可以通过视图生成树形结构的维度表。
    • ...

事实表(fact table)

表示对分析主题的度量。比如上面那个例子中,99元就是事实信息。事实表包含了与各维度表相关联的外码,并通过 JOIN 方式与维度表关联。事实表的度量通常是数值类型,且记录数会不断增加,表规模迅速增长。

  • 事实表类型

    • 事务事实表
      • 它是面向事务的,其粒度是每一行对应一个事务,它是最细粒度的事实表。
    • 周期快照事实表
      • 它是按照良好的时间周期间隔(每天,每月)来捕捉业务活动的执行情况,一旦装入事实表就不会再去更新,它是事务事实表的补充,而非替代品。
    • 累积快照事实表
      • 它用于描述业务过程中某个不确定时间跨度里的活动,它随着业务活动的发生会不断的更新。
  • 三种事实表类型之间的区别:

事务事实表 周期快照事实表 累积快照事实表
代表的时间段 时间点 规律可预见间隔 不确定时间跨度,一般是短期
粒度 每个事件事务一行 每段时间一行 每个生命周期一行
事实表加载 插入 插入 插入与更新
事实表更新 不重新加载 不重新加载 重新加载
日期维度 事务日期 时间段终止日期 标准关键环节的多个日期
事实 事务活动 预定时间间隔的性能 给定生命周期的性能

维度建模优点

  • 便于理解
  • 提高查询性能
  • 对称性
  • 可扩展性

维度建模的三种模式

1.星形模式

星形模式(Star Schema)是最常用的维度建模方式,下图展示了使用星形模式进行维度建模的关系结构:

可以看出,星形模式的维度建模由一个事实表和一组维表成,且具有以下特点:

  • 维表只和事实表关联,维表之间没有关联;
  • 每个维表的主码为单列,且该主码放置在事实表中,作为两边连接的外码;
  • 以事实表为核心,维表围绕核心呈星形分布;

2.雪花模式

雪花模式(Snowflake Schema)是对星形模式的扩展,每个维表可继续向外连接多个子维表。下图为使用雪花模式进行维度建模的关系结构:

星形模式中的维表相对雪花模式来说要大,而且不满足规范化设计。雪花模型相当于将星形模式的大维表拆分成小维表,满足了规范化设计。然而这种模式在实际应用中很少见,因为这样做会导致开发难度增大,而数据冗余问题在数据仓库里并不严重。

3.星座模式

星座模式(Fact Constellations Schema)也是星型模式的扩展。基于这种思想就有了星座模式:

前面介绍的两种维度建模方法都是多维表对应单事实表,但在很多时候维度空间内的事实表不止一个,而一个维表也可能被多个事实表用到。在业务发展后期,绝大部分维度建模都采用的是星座模式。

相关文章

  • 数据仓库建模——维度建模

    数据仓库的建模方法有很多种,常见的有维度建模法、范式建模法、实体建模法等,下面主要介绍一下维度建模法。 维度建模的...

  • 数仓建模 - 维度 vs 关系

    数据仓库模型建设 模型概念 维度建模 关系建模 建模实现对比 模型选择 Data Vault 简介 数据仓库模型建...

  • Kimball维度建模技术总结

    Kimball维度建模技术几乎已经成为数据仓库建模的最佳实践。维度建模的基本概念总结。 收集业务需求 在建模工作前...

  • 传统数据仓库在大数据平台上的进化

    模型的进化 一、传统数仓的3NF模型&维度模型 数据仓库建模中维度建模和3NF建模并不是OR的关系,它们更像是上下...

  • 数据建模的理解操作

    维度建模是专门应用于分析型数据库 数据仓库 数据集市建模的方法。数据集市可以理解为是一种"小型数据仓库"。 维度建...

  • 离线数仓二

    数据仓库维度模型设计 维度建模基本概念 维度模型是数据仓库领域大师Ralph Kimall所倡导,他的《数据仓库工...

  • 数据仓库维度建模法案例

    概述 维度建模法(Dimensional Modeling)是数据仓库建模中比较常用的方法,最常见的数据模式包括 ...

  • 数据仓库

    《数据仓库工具箱 维度建模权威指南 第3版.pdf》

  • 数据仓库快速入门教程9-维度模型

    什么是维度模型? 维度模型是针对数据仓库工具优化的数据结构技术。维度建模的概念由Ralph Kimball开发,由...

  • 大数据分析基础——维度模型

    1基本概念 维度模型的概念出自于数据仓库领域,是数据仓库建设中的一种数据建模方法。维度模型主要由事实表和维度表这两...

网友评论

    本文标题:数据仓库建模——维度建模

    本文链接:https://www.haomeiwen.com/subject/ugnnsktx.html