Spark Architecture Let's have a look at Apache Spark arch...[作者空间]
HBase 对比 Redis https://db-engines.com/en/system/HBase%3BR...[作者空间]
1. 什么是 RDD RDD 是一个弹性的分布式的数据集,是 Spark 中最基础的抽象。它表示了一个可以并行操作...[作者空间]
Hadoop vs Spark Big Data Architecture https://www.youtube...[作者空间]
YARN Yarn产生背景 Yarn直接来自于MR1.0. MR1.0 问题:采用的是master slave结构...[作者空间]
Spark 并行计算框架简介 大规模数据处理 类Hadoop MapReduce的通用并行框架. 分布式计算引擎 ...[作者空间]
何为数仓DW Data warehouse(可简写为DW或者DWH)数据仓库,是在数据库已经大量存在的情况下,它是...[作者空间]
ClickHouse SQL 语法极简教程 ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统...[作者空间]