spark容错

spark容错

作者: 星辰fml | 来源:发表于2019-05-21 11:03 被阅读0次

Spark面试题
Spark Streaming
3 spark streaming运行机制与架构
spark容错
Spark Streaming概述
第3课:通过案例对 spark streaming 透彻理解三板
Spark Streaming一致性、容错机制分析
13 Spark Streaming源码解读之Driver容错安
【Spark】Spark容错机制
13.spark streaming之快速入门

传统的容错机制有两种：
1.设计检查点
2.记录数据的更新
在Spark中有宽依赖和窄依赖问题：
窄依赖：父RDD的分区只能被一个子RDD所依赖
宽依赖：父RDD的分区被多个RDD所依赖
窄依赖，如果出错，则只需要重新计算其依赖的父RDD中的一个分区的数据即可，进行恢复
宽依赖，如果出错，则需要将父RDD中的所有分区都进行计算，才能进行数据恢复，而且在父RDD恢复重新计算的时，有的数据会被其他的子RDD所依赖，但是这些子RDD并没有出错，这样就出现的数据冗余计算了。
所以，在宽依赖中，对于lineage太长的，可以做中间阶段进行设置检查点，如果出现错误，则可以直接从检查点中进行恢复数据，而不用从父RDD的全部分区重新计算，设置检查点机制，可以减少很多资源开销。

相关文章

Spark面试题
1. spark如何实现容错性? spark的容错性有2个手段, 检查点和RDD血统检查点: checkpoin...
Spark Streaming
Spark treaming简介 Spark Streaming是Spark中的一个组件,具有高吞吐量,容错能力强...
3 spark streaming运行机制与架构
Spark Streaming Job架构与运行机制 Spark Streaming 容错架构与运行机制 Spar...
spark容错
传统的容错机制有两种：1.设计检查点2.记录数据的更新在Spark中有宽依赖和窄依赖问题：窄依赖：父RDD的分区...
Spark Streaming概述
简介 Spark Streaming 是 Spark Core API 的扩展，它支持弹性的,，高吞吐的，容错的实...
第3课:通过案例对 spark streaming 透彻理解三板
本期内容：1. Spark Streaming Job架构与运行机制2. Spark Streaming 容错架构...
Spark Streaming一致性、容错机制分析
Spark Streaming容错机制保障参考https://databricks.com/blog/2015/...
13 Spark Streaming源码解读之Driver容错安
Spark Streaming中Driver的容错主要是ReceiverTracker、Dstream.graph...
【Spark】Spark容错机制
引入一般来说，分布式数据集的容错性有两种方式：数据检查点和记录数据的更新。面向大规模数据分析，数据检查点操作成本...
13.spark streaming之快速入门
简介 Spark Streaming是Spark核心API的扩展，可以实现可伸缩、高吞吐量、具备容错机制的实时...

网友评论

本文标题：spark容错

本文链接：https://www.haomeiwen.com/subject/atudzqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|spark容错|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！