数据仓库-读书笔记一

作者: 数据僧 | 来源:发表于2018-01-26 14:43 被阅读236次

    DW/Bi系统业务有哪些需求(要求)

    1. 方便的存取数据
    2. 必须以一致的形式展现信息
    3. 能够适应变化
    4. 及时展现信息
    5. 数据安全
    6. 成为提高决策制定能力的权威和可信的基础
    7. 业务群体接受DW/BI系统

    DW/Bi系统人员有哪些需求(要求)

    1. 技能要求
          具有较好的信息技术基础并且了解业务
          既需要了解数据库管理的技能,也包括商业分析师的
      技能。
    2. 职责描述
          理解用户
          发布高质量、相关的、可访问的信息和分析
          维护DW/BI环境

    维度建模简介

    1. 作用

        以商业用户可理解的方式发布数据
        提供高效的查询性能
    注意:维度模型包含的信息与规范化模型包含的信息相同,但将数据以一种用户可以理解的满足查询性能要求的,灵活多变的方式进行了包装。

    2. 星型模式与OLAP多维数据库

    星型模型 星型模型举例

    OLAP采用预计算、索引策略、其它优化方法,多维数据可实现高性能查询。
    OLAP提供良好的分析性能,方便上钻和下钻操作
    OLAP提供大量的健壮的分析函数
    通常是推荐将详细的,原子的信息加载到星型模式中,然后将OLAP多维数据库移植到星型模式上。

    OLAP部署的注意事项
    1,构建于关系数据库之上的星型模式是建立OLAP多维数据库的良好物理基础。也是备份和恢复的良好的、稳定的基础
    2,OLAP对比RDBMS的性能优势,这一优势随着计算机硬件和软件的发展变得没那么重要
    3,在不同的OLAP工具之间建立BI应用比在不同关系数据库之间建立BI更困难。
    4,OLAP多维数据通常比RDBMS提供更多的复杂安全选项。例如限制访问细节数据
    5,OLAP提供比RDBMS更加丰富的分析能力
    6,OLAP方便支持缓慢变化维度类型2变化。但是当需要使用其它缓慢变化维度技术重写数据时,多维数据库通常需要被全部或者部分的重新处理
    7,OLAP方便支持事务和周期性快照事实表,由于重写数据的限制而无法处理累计快照事实表
    8,OLAP支持具有层次不确定的复杂不规则层次结构。例如:组织结构图或物料表
    9,OLAP相对于关系数据库,能实现对下钻层次的维度关键词结构提供更加详细的约束
    10,一些OLAP产品无法确保实现维度角色和别名,因此需要定义不同的物理维度

    3. 用于度量的事实表

    事实定义:表示某个业务度量
    存储什么内容:组织机构业务过程事件的性能度量结果。
    存储原则:将来源于同一个业务过程的底层度量结果存储于一个维度模型中。
    为什么这么存储:因为数据量巨大。
    事实有哪些类型:可加,半可加,不可加
    事实表的粒度的类型:事务,周期性,累计快照
    注意事项:
        1,允许多个组织的业务用户访问同一个单一的集中式数据仓库,确保他们能在整个企业中使用一致的数据。
        2,物理世界的每个度量事件对应的事实表行具有一对一的关系。每行的数据是一个特定级别的细节(粒度)数据
        3,同一个事实表的度量行比具有相同的粒度

    4. 用于描述环境的维度表

    存储的内容:包含于业务过程度量事件有关的文本环境
    维度表的语意:“谁(who),什么(what),哪里(where),何时(when),为什么(why),如何(how)”
    维度表的特点:通常有多列(多个属性),和事实表比较 维度表通常小的多,单一主键
    作用:是用于和事实表连接操作时实现参照完整性的基础,可作为查询约束、分组、报表标识。
    注意:
        1,尽量减少在维度表中使用代码,将代码替换为详细的文本属性。尽量减少他们对代码转换注释的依赖。
        2,为维度属性提供详细的业务术语耗费的精力越多,效果越好,强大的维度属性带来的回报是健壮的分片-分块能力。
        3,连续值数字基本上可以认为属于事实,来自于不太大列表的离散数字基本可以认为是维度属性
        4,维度表可以冗余,不一定要满足第三范式,通常是非规范化的。对于维度表的存储空间的权衡 往往 关注 简单性和可访问性;是否方便使用,是否能提高查询性能。

    5. 星型模式中维度与事实的连接

    维度与事实连接

    参考资料

    数据仓库工具箱


    如果您觉得我用心了,觉得您有所收获,麻烦关注下我吧,您的关注就是我的动力,因为我不是一个人在前行。

    数据僧微信公众号

    相关文章

      网友评论

        本文标题:数据仓库-读书笔记一

        本文链接:https://www.haomeiwen.com/subject/pbaiaxtx.html