DW/Bi系统业务有哪些需求(要求)
- 方便的存取数据
- 必须以一致的形式展现信息
- 能够适应变化
- 及时展现信息
- 数据安全
- 成为提高决策制定能力的权威和可信的基础
- 业务群体接受DW/BI系统
DW/Bi系统人员有哪些需求(要求)
- 技能要求
具有较好的信息技术基础并且了解业务
既需要了解数据库管理的技能,也包括商业分析师的
技能。 - 职责描述
理解用户
发布高质量、相关的、可访问的信息和分析
维护DW/BI环境
维度建模简介
1. 作用
以商业用户可理解的方式发布数据
提供高效的查询性能
注意:维度模型包含的信息与规范化模型包含的信息相同,但将数据以一种用户可以理解的满足查询性能要求的,灵活多变的方式进行了包装。
2. 星型模式与OLAP多维数据库
星型模型 星型模型举例OLAP采用预计算、索引策略、其它优化方法,多维数据可实现高性能查询。
OLAP提供良好的分析性能,方便上钻和下钻操作
OLAP提供大量的健壮的分析函数
通常是推荐将详细的,原子的信息加载到星型模式中,然后将OLAP多维数据库移植到星型模式上。
OLAP部署的注意事项
1,构建于关系数据库之上的星型模式是建立OLAP多维数据库的良好物理基础。也是备份和恢复的良好的、稳定的基础
2,OLAP对比RDBMS的性能优势,这一优势随着计算机硬件和软件的发展变得没那么重要
3,在不同的OLAP工具之间建立BI应用比在不同关系数据库之间建立BI更困难。
4,OLAP多维数据通常比RDBMS提供更多的复杂安全选项。例如限制访问细节数据
5,OLAP提供比RDBMS更加丰富的分析能力
6,OLAP方便支持缓慢变化维度类型2变化。但是当需要使用其它缓慢变化维度技术重写数据时,多维数据库通常需要被全部或者部分的重新处理
7,OLAP方便支持事务和周期性快照事实表,由于重写数据的限制而无法处理累计快照事实表
8,OLAP支持具有层次不确定的复杂不规则层次结构。例如:组织结构图或物料表
9,OLAP相对于关系数据库,能实现对下钻层次的维度关键词结构提供更加详细的约束
10,一些OLAP产品无法确保实现维度角色和别名,因此需要定义不同的物理维度
3. 用于度量的事实表
事实定义:表示某个业务度量
存储什么内容:组织机构业务过程事件的性能度量结果。
存储原则:将来源于同一个业务过程的底层度量结果存储于一个维度模型中。
为什么这么存储:因为数据量巨大。
事实有哪些类型:可加,半可加,不可加
事实表的粒度的类型:事务,周期性,累计快照
注意事项:
1,允许多个组织的业务用户访问同一个单一的集中式数据仓库,确保他们能在整个企业中使用一致的数据。
2,物理世界的每个度量事件对应的事实表行具有一对一的关系。每行的数据是一个特定级别的细节(粒度)数据
3,同一个事实表的度量行比具有相同的粒度
4. 用于描述环境的维度表
存储的内容:包含于业务过程度量事件有关的文本环境
维度表的语意:“谁(who),什么(what),哪里(where),何时(when),为什么(why),如何(how)”
维度表的特点:通常有多列(多个属性),和事实表比较 维度表通常小的多,单一主键
作用:是用于和事实表连接操作时实现参照完整性的基础,可作为查询约束、分组、报表标识。
注意:
1,尽量减少在维度表中使用代码,将代码替换为详细的文本属性。尽量减少他们对代码转换注释的依赖。
2,为维度属性提供详细的业务术语耗费的精力越多,效果越好,强大的维度属性带来的回报是健壮的分片-分块能力。
3,连续值数字基本上可以认为属于事实,来自于不太大列表的离散数字基本可以认为是维度属性
4,维度表可以冗余,不一定要满足第三范式,通常是非规范化的。对于维度表的存储空间的权衡 往往 关注 简单性和可访问性;是否方便使用,是否能提高查询性能。
5. 星型模式中维度与事实的连接
维度与事实连接参考资料
数据仓库工具箱
如果您觉得我用心了,觉得您有所收获,麻烦关注下我吧,您的关注就是我的动力,因为我不是一个人在前行。
数据僧微信公众号
网友评论