美文网首页
数据仓库系列1-数据仓库介绍

数据仓库系列1-数据仓库介绍

作者: 只是甲 | 来源:发表于2021-11-29 16:52 被阅读0次
image.png

一. 数据仓库定义

数据仓库(Data Warehouse,简称DW)是面向主题的、集成的、稳定的、反映历史变化的数据集合。

  1. 面向主题
    主题是业务数据特点的一种抽象表达,一般从主题名称字面意思即可大致了解主题下数据的业务意义。常见主题如客户主题,其下实体有客户基本信息、客户资产信息等等。

  2. 集成
    包括数据的集成及编码规则的集成。数据仓库中的数据通常来自于各不同源业务应用系统,在入数据仓库时,这些数据可能被集成。另外,由于应用系统间各自独立,数据编码规则存在差异,为保证数据的一致性,编码规则需集成。如:A系统中A表存有客户张三的个人信息{name:‘张三’,sex:‘M’,address:‘长沙’},B系统中B表张三信息{name:‘张三’,sex:‘01’,age:27},那么在数仓客户主题下张三的信息为{name:‘张三’,sex:‘01’,age:27,address:‘长沙’},涉及的数据项被集成,字段sex编码规则统一处理。

  3. 稳定
    数据仓库中的数据通常被用于决策分析之用,主要操作是加载、查询分析,而不是更新。

  4. 反映历史变化
    数据仓库中的数据有着很长的时间周期,通过历史数据的分析可以很好得了解业务的变化情况,当然前提是数据仓库有着充足且有意义的业务数据作为积累。

二. 操作型系统和分析型系统

  操作型系统完成组织的核心业务,例如下订单、更新库存、记录支付信息等等。这些系统是事务型的,核心目标是尽可能快地处理事务,同时维护数据的准确性。而象数据仓库这样的分析型系统,是通过数据分析来评估企业的经营效益。操作型系统和分析型系统的差异比较如下表所示:


image.png

三. 数据仓库的用途

  1. 整合公司所有业务数据,建立统一的数据中心
  2. 产生业务报表,用于作出决策
  3. 为网站运营提供运营上的数据支持
  4. 可以作为各个业务的数据源,形成业务数据互相反馈的良性循环
  5. 分析用户行为数据,通过数据挖掘来降低投入成本,提高投入效果
  6. 开发数据产品,直接或间接地为公司盈利

数据仓库应该具备的功能:

image.png

参考:

  1. https://blog.csdn.net/tianzongnihao/article/details/82150040
  2. https://blog.csdn.net/shenzhibiao/article/details/102925504
  3. https://wxy0327.blog.csdn.net/article/details/51757011

相关文章

网友评论

      本文标题:数据仓库系列1-数据仓库介绍

      本文链接:https://www.haomeiwen.com/subject/hdfczltx.html