# 面向主题
传统数据库,面向应用进行数据组织,业务系统相分离。
数据仓库面向主题,是较高层次上企业信息系统中的数据综合归类并进行分析。
# 集成性
通过对对分散,独立,异构的数据库数据进行抽取,清理,转换和汇总便得到了数据仓库的数据。
- 统一数据中的矛盾
- 数据综合和计算
如何进行数据的ETL
# 非易失性
数据仓库只保存过去的业务数据,不需要每一笔业务都实时更新数据仓库,而是根据商业需要每隔一段时间把一批较新的数据导入数据仓库。
数据仓库是不同时间点数据库快照的集合。以及基于这些快照进行统计、综合和重组的导出数据。
数据仓库中一般有大量的查询操作,但是修改和删除操作很少。
# 实变性
数据仓库的用户不能修改数据,但是可以不断更新数据。
1.数据仓库的数据时限一般远远超过操作型数据的数据时限。
2.操作型系统存储的是当前数据,而数据仓库中的数据是历史数据。
3.数据仓库中的数据是按照时间顺序追加的,带有时间属性。
网友评论