开始之前,我们先聊下数据的分类吧。数据可以从多种维度进行分类,但从数仓开发角度看, 数据可以分为"结构化数据"、"...[作者空间]
使用Dataworks完成数仓的离线全量+实时增量ETL可以有多种具体实现方案。笔者进行了多种实践,也大概了解到各...[作者空间]
开始之前,先聊下企业数据的整体架构吧。一般来说,业务系统的数据库有较大的生产压力,大多数的做法是在企业生产库后会追...[作者空间]
从阿里巴巴在2018年底正式推出数据中台这个概念后,数据中台就如火如荼的启航了。网络上对"数据中台概念"的理解,对...[作者空间]
使用DataWorks开发过程中会存在各类配置,面对如此多的配置,如果不进行规范化的约定,后期业务过程将面临难以维...[作者空间]
伴随前台业务系统的微服务化,各微应用的数据存储于各自微服务里,使得各业务系统之间数据的关联分析、数据的全生命周期的...[作者空间]
Dataworks里的资源组分为"公共资源组"、"独享资源组"。其中"公共资源组"是全租户下使用,在任务高峰期会造...[作者空间]
数据仓库主要包含数据集成、数据计算、数据服务、数据质量、数据资产等模块。在数仓建设中,对数据开发者说最主要工作在数...[作者空间]