standalone集群

作者: Eqo | 来源:发表于2022-06-19 17:56 被阅读0次

standalone集群是spark自己带的资源调度集群
yarn是所有符合其标准的程序跟他申请资源他都给
Spark Standalone集群，仅仅只能向其提交运行Spark Application程序，其他应用无法提交运行

image.png

主从架构(master -slave )
主角色 master ,管理整个集群的资源
从角色 workers,管理每台机器的资源
历史服务器 history server

master是集群中含有Master进程的节点，slave是集群中的Worker节点含有Executor进程

image.png

应用运行架构

8、Spark 计算引擎：Spark应用组成.png

当将Spark Application运行在集群上时，所有组件组成如下所示:
第一部分、集群资源管理框架，以Standalone 集群为例

主节点Master：集群老大，管理节点
- 接受客户端请求、管理从节点Worker节点、资源管理和任务调度
- 类似YARN中ResourceManager
从节点Workers：集群小弟，工作节点
- 使用自身节点的资源运行Executor进程：给每个Executor分配一定的资源
- 类似YARN中NodeManager

第二部分应用组成应用管理者driver 和应用执行者executors

应用管理者Driver Program：每个应用老大
- 向主节点申请Executor资源，让主节点在从节点上根据需求配置启动对应的Executor
- 解析代码逻辑：将代码中的逻辑转换为Task
- 将Task分配给Executor去运行
- 监控每个Executor运行的Task状态

应用执行者Executors：应用中干活的
- 运行在Worker上，使用Worker分配的资源等待运行Task
- 所有Executor启动成功以后会向Driver进行注册
- Executor收到分配Task任务，运行Task,每个task 就是一个进程
- 可以将RDD数据缓存到Executor内存