一、写在前面 2016年,数栈开始正式投入研发,发展至今,已经拥有了:实时开发、离线开发、算法开发这些开发平台;数...[作者空间]
欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq...[作者空间]
作者:张庭(菜鸟数据工程师) 导读:供应链物流场景下的业务复杂度高,业务链路长,节点多,实体多,实时数仓建设难度高...[作者空间]
关注公众号:大数据技术派,领取资料,学习大数据技术。 建模方法论 数仓的建模或者分层,其实都是为了更好的去组织、管...[作者空间]
基于 Hive 的离线数仓往往是企业大数据生产系统中不可缺少的一环。Hive 数仓有很高的成熟度和稳定性,但由于它...[作者空间]
前言 前面几篇讲过,元数据侧重于配置【驱动】编程的思想,通过建立统一的数据资产,进一步【驱动】企业数字化升级。 但...[作者空间]
在Ralph Kimball和Margy Ross 的《数据仓库工具包》一书中,提到了数据仓库设计中的10个常见陷...[作者空间]
维表是数仓中的一个概念,维表中的维度属性是观察数据的角度,在建设离线数仓的时候,通常是将维表与事实表进行关联构建星...[作者空间]
马蜂窝数据仓库的架构、模型与应用实践 (马蜂窝技术原创内容,公众号ID:mfwtech) 一、马蜂窝数据仓库与数据...[作者空间]
引言 近些年,企业对数据服务实时化服务的需求日益增多。本文整理了常见实时数据组件的性能特点和适用场景,介绍了美团如...[作者空间]
本文目录: 一、大数据时代还需要数据治理吗? 二、如何面向用户开展大数据治理? 三、面向用户的自服务大数据治理架构...[作者空间]
1. 什么是Apache Calcite ? Apache Calcite 是一款开源SQL解析工具, 可以将各种...[作者空间]