问题描述 我们最近有个项目,需要实时消费订单成单的消息,提炼完数据后把结果写入HDFS,因此checkpointC...[作者空间]
注:本文转自我的个人博客 CEP In Flink (3) - 匹配事件提取。 上篇博客提到了匹配的具体过程和相关...[作者空间]
注:本文转自我的个人博客 CEP In Flink (2) - CEP规则匹配。 上篇博客提到了Flink是基于这...[作者空间]
注: 本文转自我的博客 CEP In Flink (1) - CEP规则解析 前言 随着数据分析精细化程度的提升,...[作者空间]
前言 又是一个超长的标题(摊手┓( ´∀` )┏)。Spark Streaming 历史比较悠久,也确实非常好用,...[作者空间]
缘由 StreamingPro现在支持以SQL脚本的形式写Structured Streaming流式程序了: m...[作者空间]
前言 有的时候我们只要按条处理,追求实时性而非吞吐量的时候,类似Storm的模式就比较好了。Spark 在流式处理...[作者空间]
关于Spark Streaming中的任务有如下几个概念: Batch Job Stage Task 其实Stag...[作者空间]
大数据做了这许多年,有没有问过自己,大数据中,工作量最大和技术难度最高的,分别是什么呢? 前言 我每天都在思考,思...[作者空间]
之前我在微信朋友圈发了一段话,说明Spark Streaming 不仅仅是流式计算,也是一类通用的模式,可以让你只...[作者空间]
一、Spark Streaming 数据安全性的考虑: Spark Streaming不断的接收数据,并且不断的产...[作者空间]
上篇文章详细解析了Receiver不断接收数据的过程,在Receiver接收数据的过程中会将数据的元信息发送给Re...[作者空间]
现在依然很多人使用Azkaban/Oozie等工具衔接各个系统,通过外力让数据进行流转。而随着流式计算慢慢成熟与稳...[作者空间]
我们将概览各种信息和数据源,理解他们的结构,从批处理到流处理介绍数据处理流水线,要点如下: 从批处理到流处理介绍数...[作者空间]
事务应该具有4个属性:原子性、一致性、隔离性、持久性。这四个属性通常称为ACID特性。 原子性(atomicity...[作者空间]
1.什么是事务? 例如像银行转账,A对B转账,B是否能收到多次转账,可能性不大;或者A转给B的时候,A同样费...[作者空间]
Spark Streaming 非常适合ETL。但是其开发模块化程度不高,所以这里提供了一套方案,该方案提供了新的...[作者空间]
Spark/Spark Streaming transform 是一个很强的方法,不过使用过程中可能也有一些值得注...[作者空间]
大家刚开始用Spark Streaming时,心里肯定嘀咕,对于一个7*24小时运行的数据,cache住的RDD,...[作者空间]
Problem Statement DRA has already been implemented since ...[作者空间]