![](https://img.haomeiwen.com/i2638478/4912cbeab0aa4d98.png)
一. 数据仓库定义
数据仓库(Data Warehouse,简称DW)是面向主题的、集成的、稳定的、反映历史变化的数据集合。
-
面向主题
主题是业务数据特点的一种抽象表达,一般从主题名称字面意思即可大致了解主题下数据的业务意义。常见主题如客户主题,其下实体有客户基本信息、客户资产信息等等。 -
集成
包括数据的集成及编码规则的集成。数据仓库中的数据通常来自于各不同源业务应用系统,在入数据仓库时,这些数据可能被集成。另外,由于应用系统间各自独立,数据编码规则存在差异,为保证数据的一致性,编码规则需集成。如:A系统中A表存有客户张三的个人信息{name:‘张三’,sex:‘M’,address:‘长沙’},B系统中B表张三信息{name:‘张三’,sex:‘01’,age:27},那么在数仓客户主题下张三的信息为{name:‘张三’,sex:‘01’,age:27,address:‘长沙’},涉及的数据项被集成,字段sex编码规则统一处理。 -
稳定
数据仓库中的数据通常被用于决策分析之用,主要操作是加载、查询分析,而不是更新。 -
反映历史变化
数据仓库中的数据有着很长的时间周期,通过历史数据的分析可以很好得了解业务的变化情况,当然前提是数据仓库有着充足且有意义的业务数据作为积累。
二. 操作型系统和分析型系统
操作型系统完成组织的核心业务,例如下订单、更新库存、记录支付信息等等。这些系统是事务型的,核心目标是尽可能快地处理事务,同时维护数据的准确性。而象数据仓库这样的分析型系统,是通过数据分析来评估企业的经营效益。操作型系统和分析型系统的差异比较如下表所示:
![](https://img.haomeiwen.com/i2638478/2b178136c998cf44.png)
三. 数据仓库的用途
- 整合公司所有业务数据,建立统一的数据中心
- 产生业务报表,用于作出决策
- 为网站运营提供运营上的数据支持
- 可以作为各个业务的数据源,形成业务数据互相反馈的良性循环
- 分析用户行为数据,通过数据挖掘来降低投入成本,提高投入效果
- 开发数据产品,直接或间接地为公司盈利
数据仓库应该具备的功能:
![](https://img.haomeiwen.com/i2638478/ac795b24d9576aec.png)
网友评论