spark 2.1 sort-based shuffle

spark 2.1 sort-based shuffle

作者: Gilegamesh | 来源:发表于2017-05-31 15:35 被阅读0次

spark 2.1 sort-based shuffle
spark shuffle源码解读原理
【Spark】Spark 存储原理--shuffle 过程
Spark Shuffle
Spark Shuffle 模块③ - Sort Based S
Spark Shuffle理解
Spark Shuffle（ExternalSorter）
Spark Shuffle Write的演化
Spark shuffle机制概述
Spark中如何确定Shuffle过程中Reducer的数量

spark的shuffle从最开始的basic HashShuffle的M*R个中间文件，到优化的consalidate方式的C*R个中间文件。但他们的缺点还是太明显，在面对数据量巨大的集群运算会产生巨多的中间文件。大量的读取操作且会占用大量的Memory(易造成OOM)。所以在spark 2.0之后remove了HashShuffle，开始只使用on-heap或off-heap的sort-based shuffle。

SparkEnv.scala

它产生的中间文件为2*M个，其中M个shuffle output的data文件，M个记录Index文件。

index文件是根据task生成的目标partition id进行排序的(data并没有排序)。

SortShuffleManager.scala

Sort-based shuffle也分为两种：

一种是序列化的排序：

1.shuffle依赖不能有聚合和输出排序操作

2.shuffle序列化支持序列化过的值的迁移操作

3.shuffle产生的partitions不能超过16777216个

一种是反序列化的排序，以上3个条件之外的情况都用这个去处理。

好处呢就是：

相关文章

spark 2.1 sort-based shuffle
spark的shuffle从最开始的basic HashShuffle的M*R个中间文件，到优化的con...
spark shuffle源码解读原理
1. Sort-Based Shuffle写机制源码分析 ShuffleMapTask:核心代码 SortShuf...
【Spark】Spark 存储原理--shuffle 过程
本篇结构： Spark Shuffle 的发展 Spark Shuffle 中数据结构 Spark Shuffle...
Spark Shuffle
Spark 内存管理和消费模型 Spark Shuffle 过程 Spark Shuffle OOM 可能性分析 ...
Spark Shuffle 模块③ - Sort Based S
Spark Shuffle 模块③ - Sort Based Shuffle write 本文为 Spark 2....
Spark Shuffle理解
前言 spark shuffle 演进的历史 Spark 0.8及以前 Hash Based Shuffle Sp...
Spark Shuffle（ExternalSorter）
1、Shuffle流程 spark的shuffle过程如下图所示，和mapreduce中的类似,但在spark2....
Spark Shuffle Write的演化
目前，spark shuffle write有三种方法：hash shuffle、sort shuffle和tun...
Spark shuffle机制概述
shuffle及Spark shuffle历史简介 shuffle，中文意译“洗牌”，是所有采用map-reduc...
Spark中如何确定Shuffle过程中Reducer的数量
Spark的Shuffle操作对应到Spark运行过程中会引起Shuffle的算子，比如join, reparti...

网友评论

本文标题：spark 2.1 sort-based shuffle

本文链接：https://www.haomeiwen.com/subject/bvvdfxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|spark 2.1 sort-based shuffle|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！