Flink状态管理和容错机制

作者: 少校1222 | 来源:发表于2020-05-19 15:32 被阅读0次

Flink状态管理和容错机制
flink状态管理及容错机制
Flink状态管理与容错机制
Flink检查点机制与状态管理
flink状态管理和容错
flink状态管理和容错
Flink 2.2CheckPoint
Flink容错机制-双十一神话的安全保障
Flink详解系列之八--Checkpoint和Savepoin
Flink Checkpoint机制解析-代码走读

Apache Flink® — Stateful Computations over Data Streams（数据流上的有状态计算）

一、有状态的流数据处理

1、有状态的计算？

计算任务的结果不仅仅依赖于输入，还依赖于它的当前状态，其实大多数的计算都是有状态的计算。
比如wordcount,给一些word,其计算它的count,这是一个很常见的业务场景。count做为输出，在计算的过程中要不断的把输入累加到count上去，那么count就是一个state。

2、传统的流计算系统缺少对于程序状态的有效支持

状态数据的存储和访问；
状态数据的备份和恢复；
状态数据的划分和动态扩容；

在传统的批处理中，数据是划分为块分片去完成的，然后每一个Task去处理一个分片。当分片执行完成后，把输出聚合起来就是最终的结果。在这个过程当中，对于state的需求还是比较小的。

对于流计算而言，对State有非常高的要求，因为在流系统中输入是一个无限制的流，会运行很长一段时间，甚至运行几天或者几个月都不会停机。在这个过程当中，就需要将状态数据很好的管理起来。很不幸的是，在传统的流计算系统中，对状态管理支持并不是很完善。比如storm,没有任何程序状态的支持，一种可选的方案是storm+hbase这样的方式去实现，把这状态数据存放在Hbase中，计算的时候再次从Hbase读取状态数据，做更新在写入进去。这样就会有几个问题：

流计算系统的任务和Hbase的数据存储有可能不在同一台机器上，导致性能会很差。这样经常会做远端的访问，走网络和存储；
备份和恢复是比较困难，因为Hbase是没有回滚的，要做到Exactly onces 很困难。在分布式环境下，如果程序出现故障，只能重启Storm，那么Hbase的数据也就无法回滚到之前的状态。
比如广告计费的这种场景，Storm+Hbase是是行不通的，出现的问题是钱可能就会多算，解决以上的办法是Storm+mysql，通过mysql的回滚解决一致性的问题。但是架构会变得非常复杂。性能也会很差，要commit确保数据的一致性。
对于storm而言状态数据的划分和动态扩容也是非常难做。
一个很严重的问题是所有用户都会在strom上重复的做这些工作，比如搜索，广告都要在做一遍，由此限制了部门的业务发展。

3、Flink丰富的状态访问和高效的容错机制

Flink在最早设计的时候就意识到了这个问题，并提供了丰富的状态访问和容错机制。如下图所示：

Flink状态管理和容错机制

一、有状态的流数据处理

1、有状态的计算？

2、传统的流计算系统缺少对于程序状态的有效支持

3、Flink丰富的状态访问和高效的容错机制

二、Flink中的状态管理

1、Keyed States

2、Operator State

三、状态管理和容错机制实现

四、阿里相关工作介绍

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读