美文网首页
Spark任务提交方式

Spark任务提交方式

作者: 乔一波一 | 来源:发表于2019-03-13 21:10 被阅读0次

1.spark基于自带的Standalone资源调度框架,Driver部署任务到client

这里用到spark-submit一下三个参数

客户端命令:

客户端基于standalone  client提交任务 standalone-client提交任务模型

1):spark集群启动后,worker节点向master节点汇报资源,master节点掌握资源;

2):客户端提交spark application到master,Driver会在客户端启动

提交任务是才会有

3):客户端向master申请资源;

4):master收到请求后找到满足资源的worker

5):Driver向worker发送task,并且监控task的执行,与执行结果汇报客户端控制台

2.spark基于自带的Standalone资源调度框架,Driver部署任务到cluster

客户端命令:

提交后会发现控制退出打印信息

standalone-cluster提交任务模型

1):spark集群启动后,worker节点向master节点汇报资源,master节点掌握资源;

2):客户端提交Spark application,首先客户端向Master申请启动Driver(Driver不在本地启动);

3):Master收到请求随机找到一台Worker节点,启动Driver;

4):Driver向Master申请资源;

5):Master在满足资源的Worker节点上,启动Executor,Driver向Executor发送task,监控task执行,回收结果

3.spark基于yarn资源调度框架,Driver部署任务到client

yarn-client提交任务模型

1):spark集群启动后,worker节点向master节点汇报资源,ResourceManager节点掌握资源;

2):客户端提交Sparkapplication,Driver在客户端启动,客户端向ResourceManager申请启动ApplicationMaster;

3):ResourceManager随机找到一台NodeManager节点启动ApplicationMaster;

4):ApplicationMaster启动后向ResourceManager申请满足资源Executor

5):ResourceManager返回满足资源的NodeManager,ApplicationMaster在NodeManager启动Executor

6):Excutor启动之后,反向注册给Driver;

7):Driver发送task,监控执行,回收结果到客户端;

4.spark基于yarn资源调度框架,Driver部署任务到cluster

yarn-cluster提交任务模型

1): 在客户端提交Spark application,客户端向ResourceManager申请启动ApplicationMaster;

2): ResourceManager收到请求随机找到一台NodeManager节点启动ApplicationMaster(Driver);

3): ApplicationMaster启动之后向ResourceManager申请资源用于启动Executor;

4): ResourceManager返回满足资源的NodeManager节点,ApplicationMaster连接NodeManager节点启动Executor;

5): Executor反向注册给ApplicationMaster(Driver)

6): ApplicationMaster(Driver)发送task,监控task执行,回收结果;

相关文章

网友评论

      本文标题:Spark任务提交方式

      本文链接:https://www.haomeiwen.com/subject/tawgpqtx.html