美文网首页
数据仓库:数据仓库概念及技术框架

数据仓库:数据仓库概念及技术框架

作者: dex0423 | 来源:发表于2020-10-12 22:21 被阅读0次

1. 什么是数据仓库

  • 应用场景:对历史数据进行大规模的决策分析,为上层应用做准备;
  • 数据来源:结构化数据、半结构化数据、非结构化数据;

2. 数据仓库和数据库的区别

数据库 数据仓库
面向事务(OLTP)设计的 面向主题(OLAP)设计的
一般存储在线数据 一般存储历史数据
尽量避免冗余 可以引入冗余设计
为捕获数据而设计 为数据分析而设计

3. 主流数据仓库

  • Oracle Database;
  • TeraData;
  • IBM Red Brick;
  • Netzza TwinFin;
  • Greenplum;

4. 数据仓库三层模型

  • ODS 层(备份),业务数据 \ 日志数据;
  • DW 层,按照主题维度建立数据模型,维 & 事实;
    -- DWD,清洗脏数据;
    -- DDWS,按天统计用户数据;
    -- DWT,统计用户累计数据;
  • ADS,

:主题的各个属性;
事实:对于属性的度量;

  • DM 层,提供数据产品和数据分析使用的数据,一般存放于 ES、MySQL等功线上系统使用,也可能存繁育 hive 或 Druid 中供数据分析和数据挖掘使用,一般常说的宽表就是存放在这里;

5. 数据建模

  • 维度表,
    -- 表示对于分析主题所属类型的描述;
  • 事实表,
    -- 对分析主题的度量,通常表现为数值;
    -- 事实表包含了与各维度表关联的外码,并通过 join 方式与维度表关联;

6. DW 层建模

  • 星型模型,多维对单事实;
  • 雪花模型(不常用),多维对单事实;
  • 星座模型,多维对多事实,业务发展后期绝大部分采用星座模型;

7. 数据来源

  • 爬虫数据
  • 用户行为数据
    -- 多来自日志文件;
  • 业务数据
    -- 业务系统后台,如:MySQL / MongoDB;

8. 数据输出

  • 报表系统
  • 用户画像
  • 推荐系统
  • 机器学习

9. 数据仓库需要的技术框架

  • 采集:Flume / Kafka / Sqoop;
  • 存储:MySQL / Hadoop / HBase;
  • 计算:Hive / Tez;
  • 查询:Presto / Druid / Kylin;
  • 可视化:Superset;
  • 任务调度:Azkaban;
  • 集群监控:Zabbix;
  • 元数据管理:Altas;
  • 脚本:shell;

10. 数据仓库主要工作内容

  • 用户行为数据采集平台
  • 业务数据采集平台搭建
  • 数据仓库维度建模
  • 数据分析
    -- 用户、流量、会员、商品、活动、销售、地区 等主题分析;
  • 即时数据查询 \ 指标分析
  • 集群性能监控
  • 元数据管理
  • 数据质量监控

相关文章

  • 数据仓库:数据仓库概念及技术框架

    1. 什么是数据仓库 应用场景:对历史数据进行大规模的决策分析,为上层应用做准备; 数据来源:结构化数据、半结构化...

  • 数据仓库(01)什么是数据仓库,数仓有什么特点

      这里会介绍数据仓库的理解,什么是数据仓库技术,数据仓库的作用。   数据仓库,英文名称为Data Wareho...

  • <数据仓库和数据挖掘> 第一章 绪论

    1.数据仓库 数据仓库是以关系数据库,并行处理和分布式技术为基础的信息新技术. 数据仓库是一个面向主题的,集成的,...

  • 数据仓库生命周期模型

    无论数据仓库技术如何变化,从RDBMS到NoSQL,从传统技术到大数据,其实只是实现技术手段的变化,数据仓库建设生...

  • 大数据经典学习路线(及供参考)之 二

    2.1 数据仓库增强 2.1.1 数据仓库及数据模型入门 什么是数据仓库、数据仓库的意义、数据仓库核心概念、数据仓...

  • 实训总结20170923

    数据仓库概述 什么是数据仓库? 创始人W.H.Inmon在《建立数据仓库》一书中对数据仓库的定义是:数据仓库就是面...

  • 数据仓库

    目录一. 什么是数据仓库二. 数据仓库能干什么?三. 数据仓库的特点四. 数据仓库发展历程五. 数据库与数据仓库的...

  • 数据仓库快速入门教程19数据挖掘与数据仓库的区别

    数据挖掘与数据仓库的区别 什么是数据仓库? 数据仓库是一种用于收集和管理来自不同来源的数据的技术,以提供有意义的业...

  • 数据仓库与数仓建模

    1.数据仓库 1.1 什么是数据仓库 数据仓库,英文名为Data Warehouse,简写为DW或DWH。数据仓库...

  • 数据仓库技术

    数据仓库基础 数据仓库的价值 数据仓库的源数据类型 数据仓库的基本架构 数据仓库的多维数据模型 数据立方体与OLA...

网友评论

      本文标题:数据仓库:数据仓库概念及技术框架

      本文链接:https://www.haomeiwen.com/subject/uvvypktx.html