美文网首页数据仓库
实时数仓模型设计

实时数仓模型设计

作者: afansdie | 来源:发表于2019-11-17 21:35 被阅读0次

本文参考了部分互联网公司的实时数仓模型,结合目前所掌握的数仓建设的知识,简单介绍一下如何建设一个实时数仓。

一、实时数仓建设的背景

随着互联网的发展,越来越多的业务指标需要实时查看,以便于更好的进行业务分析,尤其在举行活动的时候,能够更好的把握活动的各项指标趋势,从而更好的调整策略,达到活动的目标。

二、技术选型

与flink实时处理最密不可分的就是kafka,其次flink实时数据存储还有mysql、hbase、es、Druid等还有部分公司内部开发的数据存储。作为刚开始的公司构建实时数仓,选用市面上开源的数据库就足够可以使用了。

三、数据仓库的建设

1、实时数仓的层级

在离线数仓中,大部分都会分为数据源、数据明细层、数据汇总层、面向业务层。而在实时数仓中,数据源和面向业务层直接配置成一种可实时传输数据的数据存储就好,不做过多处理,因为实时中间处理层越多,数据准确性也会越低,这边实时数仓主要内容是在数据明细层和数据汇总层。

2、实时数仓各层级的技术选型

数据源:直接配置为kafka实时消息传输;

数据明细层:一般也会选择kafka作为数据存储,如果是这层做成大宽表的话,可以选择druid,或者hbase

数据汇总层:对数据进行高度汇总后的数据,这层一般也会选择kafka作为数据存储,这样需要保证各层级的数据通过kafka能够产生依赖。

应用层:应用层根据不同的业务类型选用不同的数据存储,如果结果需要能够快速搜索,可以选用es,如果结果需要进行多维数据统计分析,可以选用druid,如果结果数据量不是很大的话,最好选用mysql,相对来说,mysql的稳定性要好一点。

维度存储:维度如果是稳定并且数据量不大的情况下可以选择mysql,但是如果维度经常变动或者字段经常增加的话,最好选用hbase进行存储。

3、实时数仓的模型设计

相关文章

  • 实时数仓模型设计

    本文参考了部分互联网公司的实时数仓模型,结合目前所掌握的数仓建设的知识,简单介绍一下如何建设一个实时数仓。 一、实...

  • 实时数仓模型

    为了计算一些实时指标,就在原来离线数仓的基础上增加了一个实时计算的链路,并对数据源做流式改造(即把数据发送到消息队...

  • 实时数仓|基于Flink1.11的SQL构建实时数仓探索实践

    实时数仓主要是为了解决传统数仓数据时效性低的问题,实时数仓通常会用在实时的OLAP分析、实时的数据看板、业务指标实...

  • 当 TiDB 与 Flink 相结合:高效、易用的实时数仓

    简介:利用实时数仓,企业可以实现实时 OLAP 分析、实时数据看板、实时业务监控、实时数据接口服务等用途。但想到实...

  • 美团点评 Flink 实时数仓经验分享

    转载:原文地址 实时数仓建设目的 解决传统数仓的问题 实时数仓是一个很容易让人产生混淆的概念。实时数仓本身似乎和把...

  • 专治数仓疑难杂症!美团点评 Flink 实时数仓应用经验分享

    实时数仓建设目的 解决传统数仓的问题 实时数仓是一个很容易让人产生混淆的概念。实时数仓本身似乎和把 PPT 黑色的...

  • 美团点评 Flink 实时数仓经验分享[转]

    原文地址 实时数仓建设目的 解决传统数仓的问题 实时数仓是一个很容易让人产生混淆的概念。实时数仓本身似乎和把 PP...

  • 美团实时数仓建设

    实时数仓和传统数仓的对比 实时数仓和传统数仓的对比主要可以从四个方面考虑:●第一个是分层方式,离线数仓为了考虑到效...

  • 易企秀实时数仓设计

    目标 在一定并发范围内为内部用户提供稳定、快速的实时多维交互分析功能 设计 我们以尽可能快的方式将业务数据同步过来...

  • 数据岗位技能总结

    数据仓库 技能 数据仓库研发;数据集市研发;用户画像研发;实时数仓开发; 数据仓库建设方法,对3NF范式,星型模型...

网友评论

    本文标题:实时数仓模型设计

    本文链接:https://www.haomeiwen.com/subject/tgrmictx.html