PS:无法复制表格样式,只能截图了[作者空间]
在使用Hive搭建数据仓库,处理数据时,同传统数仓的结构化数据不同,我们经常会遇到一些非结构化的数据,json格式...[作者空间]
数据库和数据仓库这几个字看起来都差不多,不就多个仓字嘛,又不是多了苍老师? 从本质上来说,数据库和数据仓库都是数据...[作者空间]
大数据数仓的性能优化主要围绕以下四个方面: 调度优化 模型优化 同步任务优化 计算任务优化下面将对着四方面的优化方...[作者空间]
数据仓库(Data Warehouse ) 1.1 基本概念 数据仓库的目的是构建面向分析的集成化的数据环境, 为...[作者空间]
前篇传送门:https://www.jianshu.com/p/5ffd8730aad8 目录 Prologue(...[作者空间]
Prologue join是我们这些整天与数据打交道的人绕不开的一个词,不管是在传统的关系型数据库,还是在大数据领...[作者空间]
编译:诚历,阿里巴巴计算平台事业部 EMR 技术专家,Apache Sentry PMC,Apache Commo...[作者空间]
数据仓库作为全行或全公司的数据中心和总线,汇集了全行各系统以及外部数据,通过良好的系统架构可以保证系统稳定性和处理...[作者空间]
目录 Prologue Kudu的初衷 集群架构与共识保证 表与分区的设计 底层存储设计细节 事务与数据一致性(待...[作者空间]
1、ETL和ELT ETL是Extract、Transfrom、Load即抽取、转换、加载三个英文单词首字母的集合...[作者空间]
前一段时间,有描述过数据仓库的一些概念,但是还没说完,慢慢补充自己的一些想法吧。行文有点乱,见谅。 数据仓库,是为...[作者空间]
狭义的数据仓库数据架构用来特指数据分布,广义的数据仓库数据架构还包括数据模型、数据标准和数据治理。即包含相对静态部...[作者空间]
毕业后做了7年java应用开发,主要在一家传统软件公司做BI相关的东西。因为主要是写业务代码,大公司都有自己...[作者空间]
参考:浅墨散人:如何减少"导数"需求 前言 做数据的同学经常会遇到导数需求,各种临时导数. 本文主要也是本人工作中...[作者空间]
《大数据之路--阿里巴巴大数据实践》这本书很有价值,下面是一些读后总结,对于理解这本书也是非常有帮助的。 http...[作者空间]
继续介绍大数据系列岗位的要求,今天是数据仓库岗位,数据仓库岗位在“大数据”这仨字出来之前就已经存在好多年,...[作者空间]
随着社会快速的发展,仓储配送在人们生活中发挥着越来越重要的作用。当然仓储配送的前提是先要有仓库然后才是仓储接...[作者空间]
SQL开发神器DataGrip配置要显示的表。数据仓库庞大,数以万计的表,而具体到某个开发任务中一般只涉及一小部分...[作者空间]
一、各行业使用的分层模型 不同的行业使用的分层也有所不同,但思想都差不多 1.电信通讯 stage层 ->bdl层...[作者空间]