Flink使用中遇到的问题

作者: 寇寇寇先森 | 来源:发表于2020-01-17 11:19 被阅读0次

Flink使用中遇到的问题
使用flink 中遇到的问题总结
Flink读取HDFS中的xml（一）——读取XML的几种方式
Flink Iceberg 0.11
执行Flink Job报Too many open files问
Flink常见Checkpoint超时问题排查思路
flink 问题总结（4）如何读取sequence 文件
jmeter 使用中遇到的问题
CocoaPods 使用中遇到的问题
使用SpringBoot中遇到的问题

一、为啥checkpoint总超时

数据处理和 barrier 处理都由主线程处理，如果主线程处理太慢（比如使用 RocksDBBackend，state 操作慢导致整体处理慢），导致 barrier 处理的慢，也会影响整体 Checkpoint 的进度，在这一步我们需要能够查看某个 PID 对应 hotmethod，这里推荐两个方法：
1、多次连续 jstack，查看一直处于 RUNNABLE 状态的线程有哪些；
2、使用工具 AsyncProfile dump 一份火焰图，查看占用 CPU 最多的栈；

二、作业失败，如何使用检查点

只需要指定检查点路径重启任务即可
bin/flink run -s :checkpointMetaDataPath [:runArgs]
checkpointMetaDataPath ：这个是检查点元数据路径，并不简单是所配置的检查点的路径
参考：https://blog.csdn.net/lt793843439/article/details/89641904