目录
模块架构
spark-arch-01.png集群架构
spark-arch-02.png-
Master/Slave
-
Driver/Cluster Manager/Work
Driver控制节点
Cluster Manager集群资源管理器
Work工作节点
运行流程
-
构建Spark Application运行环境 即由任务Driver控制节点创建SparkContext
-
SparkContext根据RDD的依赖关系构建DAG(Directed Acyclic Graph)
-
DAG调度器(DAGScheduler)将DAG分解成多个阶段(Stage) 每个阶段都是一个任务集(TaskSets)
-
DAG调度器(DAGScheduler)通过Cluster Manger将任务(Task)调度到Executor上执行
-
任务(Task)在Executor上执行 运行完毕后释放所有资源
网友评论