Spark性能优化之shuffle性能优化

作者: 有一束阳光叫温暖 | 来源:发表于2019-02-15 17:59 被阅读0次

目录
Awesome Extra
Spark性能优化之shuffle性能优化
Spark 性能优化方案
Spark性能调优
Spark性能优化：数据倾斜调优（转）
Spark性能优化：开发调优篇（转）
Spark性能优化：资源调优篇（转）
spark性能调优
Alluxio文件系统在搜狗的实践Alluxio内存文件系统在搜

1.没有开启consolidation机制的性能低下的原理剖析

图一

2.开启consolidation机制的性能低下的原理剖析

图二

new SparkConf().set("spark.shuffle.consolidateFiles", "true")
spark.shuffle.consolidateFiles：是否开启shuffle block file的合并，默认为false
spark.reducer.maxSizeInFlight：reduce task的拉取缓存，默认48m
spark.shuffle.file.buffer：map task的写磁盘缓存，默认32k
spark.shuffle.io.maxRetries：拉取失败的最大重试次数，默认3次
spark.shuffle.io.retryWait：拉取失败的重试间隔，默认5s
spark.shuffle.memoryFraction：用于reduce端聚合的内存比例，默认0.2，超过比例就会溢出到磁盘上

目录
Spark之参数介绍 Spark之性能优化2.1. 官方性能优化指南2.2. Spark性能优化指南——基础篇2....
Awesome Extra
性能优化性能优化模式常见性能优化策略的总结 Spark 性能优化指南——基础篇 Spark 性能优化指南——高...
Spark性能优化之shuffle性能优化
1.没有开启consolidation机制的性能低下的原理剖析 2.开启consolidation机制的性能低下的...
Spark 性能优化方案
Spark 性能优化方案(转自李智慧的Spark性能优化方案)： Spark性能测试工具 •Spark性能测试基准...
Spark性能调优
《Spark性能优化：开发调优篇》《Spark性能优化：资源调优篇》《Spark性能优化：数据倾斜调优》《Spar...
Spark性能优化：数据倾斜调优（转）
《Spark性能优化：开发调优篇》《Spark性能优化：资源调优篇》《Spark性能优化：数据倾斜调优》《Spar...
Spark性能优化：开发调优篇（转）
《Spark性能优化：开发调优篇》《Spark性能优化：资源调优篇》《Spark性能优化：数据倾斜调优》《Spar...
Spark性能优化：资源调优篇（转）
《Spark性能优化：开发调优篇》《Spark性能优化：资源调优篇》《Spark性能优化：数据倾斜调优》《Spar...
spark性能调优
[Spark性能优化指南——基础篇][Spark性能优化指南——高级篇]
Alluxio文件系统在搜狗的实践Alluxio内存文件系统在搜
本次分享主要包括了Spark shuffle 基于Alluxio的优化，以及基于Alluxio对于临时表的性能改进...