Spark shuffle优化

Spark shuffle优化

作者: clive0x | 来源:发表于2019-07-26 23:52 被阅读0次

Spark_性能调优及Spark3.0新特性
【Spark】Spark 存储原理--shuffle 过程
Spark shuffle优化
Spark-Shuffle类算子优化+
Shuffle
Spark Shuffle
Spark Shuffle 模块③ - Sort Based S
Spark Shuffle理解
Alluxio文件系统在搜狗的实践Alluxio内存文件系统在搜
spark 2.1 sort-based shuffle

ExternalSorter.scala

AppendOnlyMap:k1,v1|k2,v2|k3,v3.....|kn,vn

当内存不足（向executor申请memory不足）时，开始spill，

依次分partition分批次写，每spark.shuffle.spill.batchSize:10000写一次文件，另外一个可调整参数：

spark.shuffle.file.buffer：32k，

BlockStoreShuffleReader.scala

spark.reducer.maxSizeInFlight:48M，单shuffle任务最多同时远程读取48M

spark.reducer.maxReqsInFlight:Int.MaxValue

spark.reducer.maxBlocksInFlightPerAddress:Int.MaxValue

spark.maxRemoteBlockSizeFetchToMem:Int.MaxValue - 512

特别说明下最后一个参数，当blocksize比该参数大时，block读取至文件而非内存。

Spark不管是数据还是shuffle，首先都用内存，可以预见，随着企业级SSD的快速普及，框架淘汰可能性还是很高的。

相关文章

Spark_性能调优及Spark3.0新特性
1.spark_shuffle_分区数 spark_sql aqe 优化SparkSQL中，基于SQL分析或者D...
【Spark】Spark 存储原理--shuffle 过程
本篇结构： Spark Shuffle 的发展 Spark Shuffle 中数据结构 Spark Shuffle...
Spark shuffle优化
ExternalSorter.scala AppendOnlyMap:k1,v1|k2,v2|k3,v3........
Spark-Shuffle类算子优化+
优化就是：尽量避免使用shuffle类算子如果有可能的话，要尽量避免使用shuffle类算子。因为Spark作业...
Shuffle
# 简介 shuffle 是spark 计算核心的的部分之一，很多优化也是基于shuffle来做，所以了解它也是必...
Spark Shuffle
Spark 内存管理和消费模型 Spark Shuffle 过程 Spark Shuffle OOM 可能性分析 ...
Spark Shuffle 模块③ - Sort Based S
Spark Shuffle 模块③ - Sort Based Shuffle write 本文为 Spark 2....
Spark Shuffle理解
前言 spark shuffle 演进的历史 Spark 0.8及以前 Hash Based Shuffle Sp...
Alluxio文件系统在搜狗的实践Alluxio内存文件系统在搜
本次分享主要包括了Spark shuffle 基于Alluxio的优化，以及基于Alluxio对于临时表的性能改进...
spark 2.1 sort-based shuffle
spark的shuffle从最开始的basic HashShuffle的M*R个中间文件，到优化的con...

网友评论

本文标题：Spark shuffle优化

本文链接：https://www.haomeiwen.com/subject/ignjrctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Spark shuffle优化|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！