(1)确定Flink作业所需资源大小

作者: 丹之 | 来源:发表于2018-11-22 10:06 被阅读107次

(1)确定Flink作业所需资源大小
flink 所需资源大小考虑
【Flink 精选】如何优化大状态作业？
flink中的JobListeningContext类
楼梯完善流程
七、复查测试文档
不同的角色
Apache Flink 进阶（一）：Runtime 核心机制剖
07:项目成本管理4
Apache Flink 进阶教程（一）：Runtime 核心机

以下6个方面是确定 Flink 集群大小时最先要考虑的一些因素：

记录数和每条记录的大小

确定集群大小的首要事情就是估算预期进入流计算系统的每秒记录数（也就是我们常说的吞吐量），以及每条记录的大小。不同的记录类型会有不同的大小，这将最终影响 Flink 应用程序平稳运行所需的资源。

不同 key 的数量和每个 key 存储的 state 大小

应用程序中不同 key 的数量和每个 key 所需要存储的 state 大小，都将影响到 Flink 应用程序所需的资源，从而能高效地运行，避免任何反压。

状态的更新频率和状态后端的访问模式

第三个考虑因素是状态的更新频率，因为状态的更新通常是一个高消耗的动作。而不同的状态后端（如 RocksDB，Java Heap）的访问模式差异很大，RocksDB 的每次读取和更新都会涉及序列化和反序列化以及 JNI 操作，而 Java Heap 的状态后端不支持增量 checkpoint，导致大状态场景需要每次持久化的数据量较大。这些因素都会显著地影响集群的大小和 Flink 作业所需的资源。