数据仓库快速入门教程5-数据建模

作者: python测试开发 | 来源:发表于2019-01-29 11:38 被阅读27次

数据建模是为要存储在数据库中的数据创建数据模型的过程。 该数据模型是概念表示

  • 数据对象
  • 不同数据对象之间的关联
  • 规则。

数据建模有助于数据的可视化表示,并对数据实施业务规则,规则遵从性和政府政策。 数据模型可确保命名约定,默认值,语义,安全性的一致性,同时确保数据质量。

数据模型强调需要哪些数据以及如何组织数据,而不是需要对数据执行哪些操作。 数据模型就像架构师的构建计划,它有助于构建概念模型并设置数据项之间的关系。

两种类型的数据模型技术是

  • 实体关系(ER)模型
  • UML(统一建模语言)

为何使用数据模型?

使用数据模型的主要目标是:

  • 准确表示数据库所需的所有数据对象。 丢失数据将导致错误并产生不正确的结果。
  • 数据模型有助于在概念,物理和逻辑层面设计数据库。
  • 数据模型结构有助于定义关系表,主键和外键以及存储过程。
  • 它提供了基本数据的清晰图像,数据库开发人员可以使用它来创建物理数据库。
  • 对 识别丢失和冗余数据也很有帮助。
  • 虽然最初创建数据模型既费力又耗时,但从长远来看,它可以使您的IT基础架构升级和维护更便宜,更快捷。

数据模型的类型

主要有三种不同类型的数据模型:

  1. 概念:此数据模型定义系统包含的内容。 此模型通常由业务涉众和数据架构师创建。 目的是组织,范围和定义业务概念和规则。
  2. 逻辑:定义如何都应该实现系统。 此模型通常由Data Architects和业务分析师创建。 目的是制定规则和数据结构。
  3. 物理 :此数据模型描述了如何使用特定的DBMS系统实现系统。 此模型通常由DBA和开发人员创建。 目的是实际实现数据库。
图片.png

概念模型

该模型的主要目的是建立实体,它们的属性以及它们之间的关系。 在此数据建模级别中,几乎没有任何实际数据库结构的详细信息。

数据模型的3个基本要素:

  • 实体 :现实世界的东西

  • 属性 :实体的特征或属性

  • 关系 :两个实体之间的依赖关系

例如:

Customer和Product是两个实体。 Customer编号和名称是Customer实体的属性
Product名称和价格是Product实体的属性
Sale是客户与产品之间的关系

图片.png

概念数据模型的特征

  • 提供组织范围内的业务概念。
  • 此类数据模型是为业务受众设计和开发的。
  • 概念模型的开发独立于硬件规范,如数据存储容量,位置或软件规范,如DBMS供应商和技术。 重点是表示用户将在“现实世界”中看到的数据。

被称为域模型的概念数据模型通过建立基本概念和范围为所有利益相关者创建了共同的词汇表。

参考资料

逻辑数据模型

逻辑数据模型将更多信息添加到概念模型元素中。 它定义了数据元素的结构并设置了它们之间的关系。

图片.png

逻辑数据模型为物理模型提供基础。 但建模结构仍然是通用的。

在此数据建模级别,未定义主键或辅助键,您需要验证并调整之前的连接关系。

逻辑数据模型的特征

  • 描述单个项目的数据需求,但可以根据项目范围与其他逻辑数据模型集成。
  • 独立于DBMS设计和开发。
  • 数据属性将具有精确精度和长度的数据类型。
  • 通常将模型的标准化过程应用到3NF。

物理数据模型

物理数据模型描述数据模型的数据库特定实现。 它提供了数据库的抽象,并有助于生成模式。 这是因为物理数据模型提供的元数据丰富。

图片.png

这种类型的数据模型还有助于可视化数据库结构。 它有助于为数据库列建模键,约束,索引,触发器和其他RDBMS功能。

物理数据模型的特征:

  • 物理数据模型描述了单个项目或应用程序所需的数据,尽管它可能与基于项目范围的其他物理数据模型集成在一起。
  • 数据模型包含表之间的关系,这些关系解决了基数和关系的可空性。
  • 针对特定版本的DBMS,位置,数据存储或项目中使用的技术而开发。
  • 列应具有精确的数据类型,已分配的长度和默认值。
  • 定义了主键和外键,视图,索引,访问配置文件和授权等。

数据模型的优点和缺点:

数据模型的优点:

  • 设计数据模型的主要目标是确保功能团队提供的数据对象准确表示。
  • 数据模型应足够详细,以用于构建物理数据库。
  • 数据模型中的信息可用于定义表,主键和外键以及存储过程之间的关系。
  • 数据模型可帮助企业在组织内部和跨组织进行通信。
  • 数据模型有助于在ETL过程中记录数据映射
  • 帮助识别正确的数据源以填充模型

数据模型的缺点:

  • 对于开发者数据模型,应该知道物理数据存储的特​​征。
  • 复杂的应用程序开发,管理。
  • 结构中细小的变化需要在整个应用中进行修改。
  • DBMS中没有设置数据操作语言。

结论

  • 数据建模是为要存储在数据库中的数据开发数据模型的过程。
  • 数据模型可确保命名约定,默认值,语义,安全性的一致性,同时确保数据质量。
  • 数据模型结构有助于定义关系表,主键和外键以及存储过程。
  • 概念,逻辑和物理有三种类型。
  • 概念模型的主要目的是建立实体,它们的属性以及它们之间的关系。
  • 逻辑数据模型定义数据元素的结构并设置它们之间的关系。
  • 物理数据模型描述数据模型的数据库特定实现。
  • 设计数据模型的主要目标是确保功能团队提供的数据对象准确表示。
  • 最大的缺点是,即使是较小的结构变化也需要在整个应用中进行修改。

相关文章

  • 数据仓库快速入门教程5-数据建模

    数据建模是为要存储在数据库中的数据创建数据模型的过程。 该数据模型是概念表示 数据对象 不同数据对象之间的关联 规...

  • 数仓建模 - 维度 vs 关系

    数据仓库模型建设 模型概念 维度建模 关系建模 建模实现对比 模型选择 Data Vault 简介 数据仓库模型建...

  • 5000字长文分享!数据仓库的建设与框架终于有人给讲明白了

    数据仓库,这个几乎是所有大数据开发面试必问的话题。比如数据仓库的分层架构?为什么需要数据仓库建模?数据仓库建模的原...

  • KAP v2.5新特性之智能化的建模

    为什么企业需要快速建模的能力? 数据仓库作为一种数据环境,具有面向分析、提供管理决策支持的重要作用。而在数据仓库中...

  • 数据建模的理解操作

    维度建模是专门应用于分析型数据库 数据仓库 数据集市建模的方法。数据集市可以理解为是一种"小型数据仓库"。 维度建...

  • 离线数仓二

    数据仓库维度模型设计 维度建模基本概念 维度模型是数据仓库领域大师Ralph Kimall所倡导,他的《数据仓库工...

  • 数据仓库维度建模法案例

    概述 维度建模法(Dimensional Modeling)是数据仓库建模中比较常用的方法,最常见的数据模式包括 ...

  • BI建模原则和常见问题

    BI建模的质量直接影响数据仓库项目的质量,所以在建模前,要对数据仓库的架构组成、大小以及模型功能有明确的定义。 影...

  • Excel快速入门教程7-预算实例

    Excel快速入门教程1-简介 Excel快速入门教程2-加减乘除 Excel快速入门教程3-Excel数据验证 ...

  • 数据仓库

    《数据仓库工具箱 维度建模权威指南 第3版.pdf》

网友评论

    本文标题:数据仓库快速入门教程5-数据建模

    本文链接:https://www.haomeiwen.com/subject/xkxxsqtx.html