Spark内核分析之SparkContext初始化源码分析

作者: z小赵 | 来源:发表于2017-12-20 21:19 被阅读141次

Spark内核分析之SparkContext初始化源码分析
Spark源码分析小结
Spark源码之SparkContext
Spark 源码分析（三）: SparkContext 初始化之
Spark内核分析之Spark的HA源码分析
Spark源码分析七-SparkContext 的初始化过程
【Spark】SparkContext源码解读
Spark内核源码深度分析
Spark源码：初始化SparkContext
ijkplayer源码分析之audio与opensl es初始化

上一篇介绍了spark作业提交的三种方式，从本篇开始逐一介绍Spark作业运行流程中各个组件的内部工作原理。如标题所说，我们先来看看SparkContext在Spark作业提交后做了哪些事情，工作流程如下图所示；（注意：本篇文章及后续源码分析所有内容全部基于spark1.3.0源码进行分析，后续不再赘述）

SparkContext初始化流程图

1.Spark作业提交以后，通过SparkContext的createTaskScheduler()方法来初始化scheduler（TaskSchedulerImpl）和backend（SparkDeploySchedulerBackend）对象；

2.通过scheduler的initialize()方法初始化其对应的线程池；

3.调用scheduler的start()方法，在scheduler的start()方法内部调用backend的start()方法；

4.在backend的start()方法内部，创建AppClient对象，并通过该对象的start()方法调用RegisterWithMaster方法，通过该方法向Master请求注册；

5.Master调用worker，worker启动executor后向backend注册信息；

下面附上源码部分截图；

SparkContext初始入口

初始化TaskScheduler等相关信息

初始化taskScheduler线程池及调度方式

taskScheduler的start方法

backend的start方法

初始化AppClient,调用registerWithMaster()方法

registerWithMaster方法实现

以上即为SparkContext的初始化过程，在这个过程中同时也初始化了两外两个重要的组建，分别为DAGScheduler和Spark UI；启动DAGScheduler底层是基于DAGSchedulerEventProcessActor进行通信的，SparkUI是通过底层的jetty服务器来提供web服务的；针对这两个组件后续会有详细讲解。

总结：以上即为SparkContext的初始化过程，源码涉及的类有：SparkContext，TaskSchedulerImpl，SparkDeploySchedulerBackend，AppClient等，有兴趣的可以查看所有详细实现。欢迎关注。

如需转载，请注明：

上一篇：Spark内核分析之spark作业的三种提交方式

本篇：Spark内核分析之SparkContext初始化源码分析

Spark内核分析之SparkContext初始化源码分析
上一篇介绍了spark作业提交的三种方式，从本篇开始逐一介绍Spark作业运行流程中各个组件的内部工作原理。如标题...
Spark源码分析小结
Spark源码分析小结通过前面对Master,worker,executor,sparkContext,DAGS...
Spark源码之SparkContext
Spark源码之SparkContext介绍篇 SparkContext介绍 SparkContext作为spar...
Spark 源码分析（三）: SparkContext 初始化之
前面已经分析到了 driver 进程成功在某台 worker 上启动了，下面就开始执行我们写的那些代码了。以一个 ...
Spark内核分析之Spark的HA源码分析
Spark作业运行的集群环境有两种，分别基于standalone模式和Yarn集群模式。我们知道Yarn集群提供了...
Spark源码分析七-SparkContext 的初始化过程
参考：https://www.cnblogs.com/johnny666888/p/11116052.html s...
【Spark】SparkContext源码解读
SparkContext的初始化 SparkContext是应用启动时创建的Spark上下文对象，是进行Spark...
Spark内核源码深度分析
Spark内核架构术语 • Application：基于Spark的用户程序，包含了一个driver progr...
Spark源码：初始化SparkContext
源码目录提交 Application 到 Spark，创建启动 Driver，在 Driver 内开始执行自己的...
ijkplayer源码分析之audio与opensl es初始化
ijkplayer源码分析之opengl与surface关联初始化 =======================...