美文网首页
数据仓库基本概念

数据仓库基本概念

作者: simon000 | 来源:发表于2016-08-27 09:40 被阅读337次

基本概念

1、数据仓库
数据仓库一词尚没有一个统一的定义,著名的数据仓库专家W. H. Inmon 在其著作《Buildingthe Data Warehouse》一书中给予如下描述:数据仓库(Data Warehouse) 是一个面向主题的(SubjectOri2ented) 、集成的( Integrate ) 、相对稳定的(Non -Volatile ) 、反映历史变化( TimeVariant) 的数据集合用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。

2、数据集市
为最大限度地实现灵活性,集成的数据仓库的数据应该存储在标准RDBMS 中,并经过规范的数据库设计,以及为了提高性能而增加一些小结性信息和不规范设计。这种类型的数据仓库设计被称为原子数据仓库。原子数据仓库的子集,又称为数据集市。

3、维度表 & 事实表
维度表包含对分析主题所属类型的描述,如商业、组织或企业。维度表的列通常包含文本类型的描述信息,也可能是数值型的描述信息(如产品重量、顾客收入水平等);事实表包含对分析主题的度量,同时包含与维度表关联的外码。 维度表和事实表是维度建模所包含的表,维度建模除了使用常规的关系概念(主码、外码、完整性约束等)外,维度建模同时包含了维度表和事实表两种类型的表。


4、主数据
企业主数据是用来描述企业核心业务实体的数据,比如客户、合作伙伴、员工、产品、物料单、账户等;它是具有高业务价值的、可以在企业内跨越各个业务部门被重复使用的数据,并且存在于多个异构的应用系统中。主数据管理是指一整套的用于生成和维护企业主数据的规范、技术和方案,以保证主数据的完整性、一致性和准确性。

5、元数据
元数据(Meta Data)是关于数据的数据,当人们描述现实世界的现象时,就会产生抽象信息,这些抽象信息便可以看作是元数据,元数据主要用来描述数据的上下文信息。通俗的来讲,假若图书馆的每本书中的内容是数据的话,那么找到每本书的索引则是元数据,元数据之所以有其它方法无法比拟的优势,就在于它可以帮助人们更好的理解数据,发现和描述数据的来龙去脉,特别是那些即将要从OLTP系统上升到DW/BI体系建设的企业,元数据可以帮他们形成清晰直观的数据流图,元数据是数据管控的基本手段。按其描述对象的不同可以划分为三类元数据:技术元数据、业务元数据和管理元数据。这三种元数据的具体描述如下:

** 技术元数据 ** 技术元数据是描述数据系统中技术领域相关概念、关系和规则的数据,主要包括对数据结构、数据处理方面的特征描述,覆盖数据源接口、数据仓库与数据集市存储、ETL、OLAP、数据封装和前端展现等全部数据处理环节;
**业务元数据 ** 业务元数据是描述数据系统中业务领域相关概念、关系和规则的数据,主要包括业务术语、信息分类、指标定义和业务规则等信息;
**管理元数据 ** 管理元数据是描述数据系统中管理领域相关概念、关系和规则的数据,主要包括人员角色、岗位职责和管理流程等信息。

(未完待续)

相关文章

  • 离线数仓二

    数据仓库维度模型设计 维度建模基本概念 维度模型是数据仓库领域大师Ralph Kimall所倡导,他的《数据仓库工...

  • 51cto赵强HADOOP学习(十)

    什么是Hive?Hive的体系结构 数据仓库的基本概念 数据仓库(DataWarehouse,DW),是一个面向主...

  • 数据仓库之数据分析

    数据仓库之数据分析 一、课前准备 二、课堂主题 本课程主要为大家揭秘数据仓库的基本概念,以及数据仓库的模型构建,并...

  • 数据仓库-Hive

    数据仓库(Data Warehouse ) 1.1 基本概念 数据仓库的目的是构建面向分析的集成化的数据环境, 为...

  • 数据仓库基本概念

    基本概念 1、数据仓库数据仓库一词尚没有一个统一的定义,著名的数据仓库专家W. H. Inmon 在其著作《Bui...

  • 预备知识

    数据仓库定义 数据仓库的基本概念 面向主题的、集成的、非易失的、反应历史变化的,数据集合,用于支持管理决策。 数据...

  • 数据仓库基本概念和与数据库的区别

    # 数据仓库基本概念 数据仓库 DW 构建面向分析的集成化数据环境。 本身不产生数据。数据来源于外部,并且开放给外...

  • 数据仓库-基本概念

    引言 数据仓库作为单独的数据存储创建与组织中,其主要目的是数据分析,专为查询而设计。 将数据仓库的创建转换为单独的...

  • 数据仓库基本概念

    转载自:https://www.cnblogs.com/traditional/p/9205300.html 数仓...

  • 大数据分析基础——维度模型

    1基本概念 维度模型的概念出自于数据仓库领域,是数据仓库建设中的一种数据建模方法。维度模型主要由事实表和维度表这两...

网友评论

      本文标题:数据仓库基本概念

      本文链接:https://www.haomeiwen.com/subject/ziwzsttx.html