Spark1.3.1Shuffle源码分析

Spark1.3.1Shuffle源码分析

作者: LancerLin_LX | 来源:发表于2018-06-17 17:02 被阅读0次

Spark1.3.1Shuffle源码分析
Android源码分析之RecyclerView源码分析(二)—
Android源码分析之RecyclerView源码分析(一)—
Android源码分析之ListView源码
Kafka源码分析-Content Table
CountDownLatch源码分析
Condition源码分析
ReentrantReadWriteLock源码分析
ReentrantLock源码分析
Flask源码分析04：上下文Context

image.png
图片出处：https://github.com/JerryLead/SparkInternals/blob/master/markdown/english/4-shuffleDetails.md

image.png

1.ShuffleMapTasks

image.png

image.png

image.png

image.png

dirver像executor发送LaunchTask

image.png

executor接收到序列化好的task后，反序列化后执行task

image.png

CoarseGrainedExecutorBackend里的executor实际上是Executor类

image.png

new TaskRunner来执行task

image.png

image.png

image.png

所以最后是调用ShuffleMapTask.runTask()，并且通过SparkEnv获取shuffleManager，SparkEnv初始化了很多重要的组件

image.png

shuffleManager获取writer，默认的writer是HashShuffleManager,获取HashShuffleWriter调用write方法

image.png

image.png

image.png
这里有个调优参数spark.shuffle.consolidateFiles

image.png

val blockId = ShuffleBlockId(shuffleId, mapId, bucketId)

image.png

blockManager.getDiskWriter

image.png

image.png

这里可以看出，使用了NIO的文件api

image.png

回到executor的run方法中

image.png

image.png

这里分析
env.blockManager.putBytes( blockId, serializedDirectResult, StorageLevel.MEMORY_AND_DISK_SER)

image.png

image.png

image.png

image.png

写数据逻辑

image.png

spill到磁盘的逻辑

image.png

image.png

image.png

复制副本操作

image.png

image.png

最后写完数据后，上报给driver的MapStatusTracker

image.png

image.png

driver端收到后

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

2.ResultTask

image.png

image.png

image.png

3.ShuffledRDD

image.png

image.png

image.png

通过HashShuffleReader来读取数据

image.png

image.png

image.png

image.png

image.png

image.png

相关文章

Spark1.3.1Shuffle源码分析
1.ShuffleMapTasks dirver像executor发送LaunchTask executor接收到...
Android源码分析之RecyclerView源码分析(二)—
系列文章：Android源码分析之ListView源码Android源码分析之RecyclerView源码分析(一...
Android源码分析之RecyclerView源码分析(一)—
系列文章：Android源码分析之ListView源码Android源码分析之RecyclerView源码分析(一...
Android源码分析之ListView源码
系列文章：Android源码分析之ListView源码Android源码分析之RecyclerView源码分析(一...
Kafka源码分析-Content Table
Kafka源码分析-网络层-1 Kafka源码分析-网络层-2 Kafka源码分析-网络层-3 Kafka源码分析...
CountDownLatch源码分析
并发源码分析篇： ReentrantLock源码分析 ReentrantReadWriteLock源码分析 Con...
Condition源码分析
并发源码分析篇： ReentrantLock源码分析 ReentrantReadWriteLock源码分析 Con...
ReentrantReadWriteLock源码分析
并发源码分析篇： ReentrantLock源码分析 ReentrantReadWriteLock源码分析 Con...
ReentrantLock源码分析
并发源码分析篇： ReentrantLock源码分析 ReentrantReadWriteLock源码分析 Con...
Flask源码分析04：上下文Context
Flask源码分析专题目录： Flask源码分析01：框架简介 Flask源码分析02：启动流程 Flask源码分...

网友评论

本文标题：Spark1.3.1Shuffle源码分析

本文链接：https://www.haomeiwen.com/subject/awkbeftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Spark1.3.1Shuffle源码分析|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！