美文网首页
flink 所需资源大小考虑

flink 所需资源大小考虑

作者: 邵红晓 | 来源:发表于2019-10-12 10:08 被阅读0次
  1. 记录数和每条记录的大小
    估算预期进入流计算系统的每秒记录数(也就是我们常说的吞吐量),以及每条记录的大小
  2. 不同 key 的数量和每个 key 存储的 state 大小
    应用程序中不同 key 的数量和每个 key 所需要存储的 state 大小,都将影响到 Flink 应用程序所需的资源,从而能高效地运行,避免任何反压。
  3. 状态的更新频率(10s)和状态后端的访问模式
    第三个考虑因素是状态的更新频率,因为状态的更新通常是一个高消耗的动作。而不同的状态后端(如 RocksDB,Java Heap)的访问模式差异很大,RocksDB 的每次读取和更新都会涉及序列化和反序列化以及 JNI (java neative interface)操作,而 Java Heap 的状态后端不支持增量 checkpoint,导致大状态场景需要每次持久化的数据量较大。这些因素都会显著地影响集群的大小和 Flink 作业所需的资源。
    RocksDB状态后端是目前唯一支持增量 checkpoint 的后端。增量 checkpoint 非常使用于超大状态的场景,生产场景下推荐
  4. 故障重启后,资源必须保证能够应对被积压的数据流产生的峰值
  5. 网络带宽(),磁盘带宽(如果你的应用程序依赖了基于磁盘的状态后端,如 RocksDB),机器数量及其可用 CPU 和内存

相关文章

  • flink 所需资源大小考虑

    记录数和每条记录的大小估算预期进入流计算系统的每秒记录数(也就是我们常说的吞吐量),以及每条记录的大小 不同 ke...

  • (1)确定Flink作业所需资源大小

    以下6个方面是确定 Flink 集群大小时最先要考虑的一些因素: 记录数和每条记录的大小 确定集群大小的首要事情就...

  • NSBundle一

    bundle 搜索资源的时候考虑大小写。 指定所需资源的名称的时候不要包含这些修辞符(@2x\@3x\_ipone...

  • №15 7.2 估算成本

    7.2 估算成本 基本概念:对完成项目工作所需资源成本进行近似估算的过程。 过程要点: 1、需要全面考虑所有资源的...

  • Flink第二篇:集群搭建

    Flink集群搭建. Flink可以选择的部署方式有:Local、Standalone(资源利用率低)、Yarn、...

  • 聊聊flink TaskManager的memory大小设置

    序 本文主要研究一下flink TaskManager的memory大小设置 flink-conf.yaml fl...

  • flink 并行度

    Flink 作为一套分布式执行框架,计算资源可以不断的扩展。不同的任务类型,可以控制需要的计算资源。在flink整...

  • Flink JobManager高可用性(HA)

    概述 JobManager 协调每个 Flink 部署。它负责调度和资源管理。 默认情况下,每个 Flink 集群...

  • 设置tomcat启用gzip压缩的具体操作方法

    如果发现内容没有被压缩,可以考虑调整compressionMinSize大小,如果请求资源小于这个数值,则不会启用...

  • Flink部署

    Flink作为一个分布式流式计算引擎,需要计算资源才可以执行应用程序。Flink能够与目前所有通用的资源管理框架集...

网友评论

      本文标题:flink 所需资源大小考虑

      本文链接:https://www.haomeiwen.com/subject/tluxmctx.html