目前主流的数据仓库分层大多为四层,也有五层的架构,这里介绍基本的四层架构。 分别为数据贴源层(ods)、数据...[作者空间]
前言 在真实的场景中数据流往往都是没有界限的,无休止的,就像是一个通道中水流持续不断地通过管道流向别处,这样显然是...[作者空间]
Hadoop本质上是:分布式文件系统(HDFS) + 分布式计算框架(Mapreduce) + 调度系统Yarn搭...[作者空间]
维度建模是一种将数据结构化的逻辑设计方法,也是一种广泛应用的数仓建模方式,它将客观世界划分为度量和上下文。度量...[作者空间]
一、Flink运行时组件 Flink 的运行时架构中,最重要的就是两大组件:作业管理器(JobManger)和任务...[作者空间]
有Flink开发经验的用户应该知道,在flink-conf.yaml文件进行作业参数配置后,通过如下指令以Perj...[作者空间]
Flink+Clickhouse实时数仓在广投集团的最佳实践 一、业务背景 由于历史原因,大型集团企业往往多个帐套...[作者空间]
从平行计算系统的内存架构来看,目前的商用服务器大体可以分为三类,即对称多处理器结构(SMP:Symmetric M...[作者空间]
1:创建一个可以上传到hdfs文件系统的文件(wc.input) 2:编写java代码调用api完成附件的上传相当...[作者空间]
概述 因为自己在阅读源码的过程中曾经遇到过很多问题,现在稍微有一点点的经验希望分享给很多从零开始的人。Apache...[作者空间]