《大数据》专题

专题列表页

大数据相关

Apache Paimon 在同程旅行的探索实践
0
2023-04-03

摘要：本文主要介绍 Apache Paimon 在同程旅行的生产落地实践经验。在同程旅行的业务场景下，通过使用 P...[作者空间]

FeatHub：流批一体的实时特征工程平台
0
2023-03-15

摘要：本文整理自阿里巴巴高级技术专家、Apache Flink/Kafka PMC 林东，在 FFA 2022 A...[作者空间]

(转) Flink开发利器StreamPark
0
2023-02-13

1. 背景 Hadoop体系虽然在目前应用非常广泛，但架构繁琐、运维复杂度过高、版本升级困难，且由于部门原因，数据...[作者空间]

Apache Doris——简介
0
2022-12-18

1.概述 Apache Doris 是一个基于MPP架构的高性能实时分析 OLAP 引擎，以其极快的速度和易用性而...[作者空间]

Yarn上运行Hello World
0
2022-11-23

前言上文提到yarn类似一个分布式操作系统，那么我们就可以自定义写一些应用在这个操作系统上运行当然也不能太过随...[作者空间]

Flink：背压，busy time和延迟之间的关系探究
0
2023-02-11

1. Back Pressure（背压）在算子层面上很好理解，背压的出现代表下游的消费者的消费速度小于上游生产者的...[作者空间]

PySpark Dataframe写入ES、Redis
0
2022-09-09

一、Dataframe写入Elasticsearch 1.1 依赖根据实际使用的spark版本及ES版本选择合适...[作者空间]

Zeppelin 0.9 版本升级之源码编译
0
2021-09-26

Zeppelin 0.9 升级之源码编译首先可以参考官方文档：https://zeppelin.apache.o...[作者空间]

PyFlink 开发环境利器：Zeppelin Notebook
0
2021-08-26

PyFlink 作为 Flink 的 Python 语言入口，其 Python 语言的确很简单易学，但是 PyFl...[作者空间]

Flink1.13 Checkpoint原理
0
2021-08-29

介绍 Flink具体如何保证exactly-once呢? 它使用一种被称为"检查点"（checkpoint）的特性...[作者空间]

Phoenix创建Hbase二级索引
0
2021-07-30

1. Phoenix简介 1.1 Phoenix定义 Phoenix是HBase的开源SQL皮肤。可以使用标准JD...[作者空间]

Flink 1.13，面向流批一体的运行时与 DataStrea
0
2021-07-01

本文由社区志愿者苗文婷整理，内容来源自阿里巴巴技术专家高赟(云骞) 在 5 月 22 日北京站 Flink Mee...[作者空间]

使用GPU加速Spark的那些事儿
0
2021-06-01

Apache Hadoop 3.1.0 2018年4月6日，Apache Hadoop 3.1.0 正式发布并原生...[作者空间]

概念2：COW与MOR
0
2021-05-23

名词解释 COW：写时复制MOR：读时合并 CopyOnWrite 思想写时复制（CopyOnWrite，简称C...[作者空间]

Flink on Zeppelin 系列之：Yarn Appli
0
2021-05-06

作者：章剑锋（简锋）去年Flink Forward在讲Flink on Zeppelin这个项目的未来时我们谈到...[作者空间]

Flink 源码之作业执行流程
0
2021-04-02

Flink源码分析系列文档目录请点击：Flink 源码分析系列文档目录[https://www.jianshu....[作者空间]

Flink 源码之StreamTask
0
2021-04-02

Flink源码分析系列文档目录请点击：Flink 源码分析系列文档目录[https://www.jianshu....[作者空间]

Delta Lake在Soul的应用实践
0
2021-03-02

简介：传统离线数仓模式下，日志入库前首要阶段便是ETL，我们面临如下问题：天级ETL任务耗时久，影响下游依赖的产...[作者空间]

使用Apache Kudu和Impala实现存储分层（转）
0
2021-01-29

https://my.oschina.net/dabird/blog/3051625[https://my.osc...[作者空间]

大数据开发：Hive on Spark设计原则及架构
0
2021-01-25

在Spark越来越受到主流市场青睐的大背景下，Hive作为Hadoop生态当中的数仓组件工具，在于Spark生态的...[作者空间]

栏目导航

延伸阅读

栏目导航

爱情美文推荐

热点爱情美文

最新爱情美文