美文网首页
[数仓项目] | 项目介绍

[数仓项目] | 项目介绍

作者: zhk779 | 来源:发表于2023-12-13 16:46 被阅读0次

1.两个项目

采集项目&数据仓库项目

  1. 从功能的角度
    采集项目:数据的采集、传输
    数据仓库项目:数据的计算为主,同时也存储数据
    2.从技术角度
    采集项目:flume,kafka,datax,maxwell
    数据仓库项目:Mysql, HDFS, Spark, Flink, MR

2.数据库和数据仓库

  1. 从名称上进行区分
    数据库:database
    数据仓库:data warehouse
  2. 从数据的来源进行区分
    数据库:企业中基础核心的业务数据
    数据仓库:数据库中的数据
  3. 从数据存储进行区分
    数据库:核心作用就是查找业务数据(行式存储、索引、不能存储海量数据)
    数据仓库:核心作用就是统计分析数据(列式存储、存海量数据)
    4.从数据价值进行区分
    数据库:保障全企业全业务的正常运行
    数据仓库:统计数据、支撑决策,可视化

3.数据流转过程

数据流转

4.统计分析的基本步骤

技术:Hive On Spark
步骤:


步骤

相关文章

  • 实时数据引擎项目介绍

    项目引言 从数仓 ETL (数据仓库技术) ETL,是英文Extract-Transform-Load的缩写,用来...

  • 基于spark快速构建数仓项目

    作者:蚂蚁金服数据中台技术专家-王飞(必武)整理:平凡的世界-zkx,转载请注明出处。 第一节会介绍一下数据仓库的...

  • 数仓—拉链表

    视频链接:数仓实战项目[https://www.bilibili.com/video/BV1bv411x7vr?p...

  • CD 网站上客户消费记录分析

    1 项目介绍 项目名称:CD 网用户消费分析 使用工具:jupyter notbook 分析步骤及内容:1. 数...

  • BBS之项目介绍,数据表设计,图片验证码

    目录 项目介绍(需求分析) 数据表设计 图片验证码 1. 项目介绍(需求分析) 模拟博客园实现大概的功能 2. 数...

  • 数仓模型设计详细讲解

    前言 今天给大家分享下数仓中的模型设计,一个好的数仓项目首先看一下它的架构以及他所用到的模型,它们使用的模型也都...

  • 良仓项目

    上线地址:http://firehoo.top/web1708/bejing-haoquanyu/shouye.h...

  • 良仓项目

    良仓项目地址 http://qxu1141770290.my3w.com/cs-rulang/cs-qiushua...

  • ELT太慢怎么行,试试PolyBase?

    传统的数仓项目,我们会用ETL把数据Extract Transform然后再Load到目标数据平台。 现在到了云和...

  • 数仓项目1:ODS贴源层

    1. 第一层ODS层 1 ODS层存放您从业务系统获取的最原始的数据,是其他上层数据的源数据。2 本项目中使用的O...

网友评论

      本文标题:[数仓项目] | 项目介绍

      本文链接:https://www.haomeiwen.com/subject/dfwvgdtx.html