由于数据仓库是由多个处理层次构成的综合系统,所以它的元数据涉及下述多个处理层次和领域。
1. 源(系统)数据定义与说明
- 源系统地址、网络连接、访问方式;
- 计算机系统、操作系统;
- 数据库服务器名、访问方式、数据结构、有关的表、列都是有可能要变化的,应作为元数据存入数据表,ETL程序和处理过程可以读入这些信息,以进行远程数据链接和数据访问,这大大优于将以上信息写入程序中的那种硬性编程方法;
- 源数据库链接说明;
- 逆向工程与源系统设计获取定义说明;
- 元数据交换说明
2.暂存区定义与说明
- 源至暂存区映像;
- 暂存区至目标区映像;
- 中间文件的传输说明;
- 中间文件的说明及使用;
- 中间文件的前后处理(清理与压缩)说明;
- 暂存区数据库的前后处理和中间处理的说明及使用。
3. 目标模型定义与说明
- 星型结构;
- 事实表定义说明
- 维表定义与说明
- 映像定义与说明
- 提取—转换—加载(ETL)定义与说明
- 综合管理系统的定义与说明
- 联机分析(OLAP)的定义与说明
- 应用软件说明
- 质量控制与安全说明
网友评论