摘要:本文主要介绍 Apache Paimon 在同程旅行的生产落地实践经验。在同程旅行的业务场景下,通过使用 P...[作者空间]
摘要:本文整理自阿里巴巴高级技术专家、Apache Flink/Kafka PMC 林东,在 FFA 2022 A...[作者空间]
1. 背景 Hadoop体系虽然在目前应用非常广泛,但架构繁琐、运维复杂度过高、版本升级困难,且由于部门原因,数据...[作者空间]
1.概述 Apache Doris 是一个基于MPP架构的高性能实时分析 OLAP 引擎,以其极快的速度和易用性而...[作者空间]
前言 上文提到yarn类似一个分布式操作系统,那么我们就可以自定义写一些应用在这个操作系统上运行 当然也不能太过随...[作者空间]
1. Back Pressure(背压)在算子层面上很好理解,背压的出现代表下游的消费者的消费速度小于上游生产者的...[作者空间]
一、Dataframe写入Elasticsearch 1.1 依赖 根据实际使用的spark版本及ES版本选择合适...[作者空间]
Zeppelin 0.9 升级之源码编译 首先可以参考官方文档:https://zeppelin.apache.o...[作者空间]
PyFlink 作为 Flink 的 Python 语言入口,其 Python 语言的确很简单易学,但是 PyFl...[作者空间]
介绍 Flink具体如何保证exactly-once呢? 它使用一种被称为"检查点"(checkpoint)的特性...[作者空间]
1. Phoenix简介 1.1 Phoenix定义 Phoenix是HBase的开源SQL皮肤。可以使用标准JD...[作者空间]
本文由社区志愿者苗文婷整理,内容来源自阿里巴巴技术专家高赟(云骞) 在 5 月 22 日北京站 Flink Mee...[作者空间]
Apache Hadoop 3.1.0 2018年4月6日,Apache Hadoop 3.1.0 正式发布并原生...[作者空间]
名词解释 COW:写时复制MOR:读时合并 CopyOnWrite 思想 写时复制(CopyOnWrite,简称C...[作者空间]
作者:章剑锋(简锋) 去年Flink Forward在讲Flink on Zeppelin这个项目的未来时我们谈到...[作者空间]
Flink源码分析系列文档目录 请点击:Flink 源码分析系列文档目录[https://www.jianshu....[作者空间]
Flink源码分析系列文档目录 请点击:Flink 源码分析系列文档目录[https://www.jianshu....[作者空间]
简介: 传统离线数仓模式下,日志入库前首要阶段便是ETL,我们面临如下问题:天级ETL任务耗时久,影响下游依赖的产...[作者空间]
https://my.oschina.net/dabird/blog/3051625[https://my.osc...[作者空间]
在Spark越来越受到主流市场青睐的大背景下,Hive作为Hadoop生态当中的数仓组件工具,在于Spark生态的...[作者空间]