Spark内核架构深度剖析

Spark内核架构深度剖析

作者: SunnyMore | 来源:发表于2018-05-29 09:43 被阅读21次

基于standalone Spark内核架构深度剖析
Spark内核架构深度剖析
scala基础语法
Dubbo源码底层深度剖析视频教程，内核解剖dubbo架构原理和
002_课程介绍特色与价值
Spark实战（2）_Spark内核架构剖析
（11）spark内核源码深度剖析
spark:spark内核架构
Spark内核源码深度剖析：宽依赖窄依赖深度剖析
IsolatedClientLoader 中的类加载机制运用

内核架构剖析.png

流程详解

1. 使用Standalone提交模式，将我们编写好的Application打成jar包上传到某Spark节点上，通过spark-submit提交Application，该命令运行后在该节点会通过反射的方式，创建和构造一个DriverActor进程，就是我们经常说的Driver，该进程负责执行我们的Application，也就是我们编写的代码。
1. 就像我们编写代码一样，Driver进程首先构造SparkConf，接着创建SparkContext对象，SparkContext在初始化的时候，会构造DAGScheduler和TaskScheduler。
1. TaskScheduler接着通过启动自己的后台进程，去连接Master，向Master注册Application。
1. Master收到Application注册的请求后，会使用自己的资源调度算法，为该Application分配运行资源，分配完成后就通知Spark集群上相应的Worker节点，为这个Application启动分配一定数量的Executor。
1. Executor启动之后会自己反向注册到TaskScheduler上去。
1. 当所有Executor完成反向注册后，DriverActor继续执行应用程序中的代码，每执行到一个action操作，就会创建一个Job，Driver会将Job提交给DAGScheduler，DAGScheduler会将Job基于Stage划分算法划分为多个Stage，然后每个Stage作为TaskSets提交到TaskScheduler，随后TaskScheduler会将TaskSet里每一个Task（Task分配算法）提交到Executor上执行。
1. Executor每接收到一个Task，都会用TaskRunner（将我们编写的代码，也就是要执行的算子以及函数，拷贝，反序列化，然后执行Task）来封装Task，然后从线程池（每一个Executor都有一个线程池）里取出一个线程，执行这个Task。
1. Task有两种，ShuffleMapTask和ResultTask，每个Job中只有最后一个Stage是ResultTask。
1. 所以最后整个Spark应用程序的执行，就是Stage分批次作为Taskset提交到Executor执行，每个Task针对RDD的一个Partition，执行我们定义的算子和函数，以此类推，直到所有操作执行结束为止。

相关文章

基于standalone Spark内核架构深度剖析
基于standalone Spark内核架构深度剖析编写spark应用程序打包成jar使用spark-submi...
Spark内核架构深度剖析
流程详解使用Standalone提交模式，将我们编写好的Application打成jar包上传到某Spark节点...
scala基础语法
Spark核心编程wordcount程序原理深度剖析图 Spark核心编程Spark架构原理
Dubbo源码底层深度剖析视频教程，内核解剖dubbo架构原理和
Dubbo源码底层深度剖析视频教程，内核解剖dubbo架构原理和架构设计15套java框架源码深度剖析视频教程（s...
002_课程介绍特色与价值
课程内容介绍：课程前置部分课程内容介绍：spark核心编程课程内容介绍：结合源码深度剖析spark内核课程内...
Spark实战（2）_Spark内核架构剖析
Standalone模式提交Spark应用的机器，Application（自己的Spark程序），spark-s...
（11）spark内核源码深度剖析
spark:spark内核架构
1.首先用spark-submit提交我们的application，那么在standalone模式下，会在clie...
Spark内核源码深度剖析：宽依赖窄依赖深度剖析
IsolatedClientLoader 中的类加载机制运用
最近看《SQL内核剖析》，提到在org.apache.spark.sql.hive.client.Isolated...

网友评论

本文标题：Spark内核架构深度剖析

本文链接：https://www.haomeiwen.com/subject/jvjojftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Spark内核架构深度剖析|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！