spark任务级重试导致的clickhouse中数据不一致

spark任务级重试导致的clickhouse中数据不一致

作者: JX907 | 来源:发表于2021-01-27 16:08 被阅读0次

spark任务级重试导致的clickhouse中数据不一致
Logstash同步Hive和Clickhouse
脚本提交spark任务会自动重试
spark sql 执行各种报错
篇五|ClickHouse数据导入(Flink、Spark、Ka
队列框架
大数据界的黑马——ClickHouse 架构概述
Spark应用不能使用crontab启动问题的解决
如何快速地将Hive中的数据导入ClickHouse
如何快速地把HDFS中的数据导入ClickHouse

问题：

有个hive2clickhouse任务，在foreachPartition中的逻辑出错时会触发stage的容错，最终任务是成功状态，但clickhouse中的数据会存在重复。（失败前已经写过一部分，clickhouse的主键又不能保证数据一致性）

期望在失败时立即停止运行，由人工干预修复整个任务。

代码大致逻辑如下：

sql.toJavaRDD().repartition(10).foreachPartition(records -> {

// 控制批次写clichouse的逻辑，此处经常会遇到clickhouse负载大而失败

});

解决方案：

设置spark task失败后不再重试，对应参数为： spark.task.maxFailures

@Override

protected SparkConf getSparkConf() {

SparkConf conf = super.getSparkConf();

conf.set("spark.task.maxFailures", "1");

return conf;

}

参考：

https://blog.csdn.net/high2011/article/details/109288539

相关文章

spark任务级重试导致的clickhouse中数据不一致
问题：有个hive2clickhouse任务，在foreachPartition中的逻辑出错时会触发stage的...
Logstash同步Hive和Clickhouse
简介工作中我们遇到了把Hive数据同步到Clickhouse的业务需求，一开始我们写Spark任务，用Spark...
脚本提交spark任务会自动重试
1）如果spark任务执行成功，不会自动重试2）如果spark任务执行失败，手动提交时不会重试3）如果spark任...
spark sql 执行各种报错
调试目的通过1、存在数据倾斜2、spark sql 执行过程中，重试次数太多日志1 日志2 日志3spark-...
篇五|ClickHouse数据导入(Flink、Spark、Ka
本文分享主要是ClickHouse的数据导入方式，本文主要介绍如何使用Flink、Spark、Kafka、MySQ...
队列框架
在实际开发中，我们需要在后台处理一些异步任务，比如说网络请求和数据的存储，根据业务的需要可能要有优先级和重试机制和...
大数据界的黑马——ClickHouse 架构概述
ClickHouse 是一个真正的列式数据库管理系统（DBMS)。在 ClickHouse 中，数据始终是按列存储...
Spark应用不能使用crontab启动问题的解决
问题我希望定时执行一个spark任务，来做数据同步在crontab中设定了定时启动spark-submit，到时...
如何快速地将Hive中的数据导入ClickHouse
如何快速地将Hive中的数据导入ClickHouse ClickHouse是面向OLAP的分布式列式DBMS。我们...
如何快速地把HDFS中的数据导入ClickHouse
如何快速地把HDFS中的数据导入ClickHouse ClickHouse是面向OLAP的分布式列式DBMS。我们...

网友评论

本文标题：spark任务级重试导致的clickhouse中数据不一致

本文链接：https://www.haomeiwen.com/subject/fgeazktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|spark任务级重试导致的clickhouse中数据不一致|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！