美文网首页
Spark核心原理,组件介绍

Spark核心原理,组件介绍

作者: 不羁之后_ | 来源:发表于2019-07-22 20:30 被阅读0次
  • standalone模式

master

负责集群资源的管理,主要负责worker的注册,driver的注册

worker

负责向master注册本机资源,负责启动Executor

Exexutor

Executor是真正的计算资源,管理本机的task。负责和driver的CoarseGraindSchedulerBackend通信,接收任务,完成任务,以及修改任务状态。

driver

客户端程序启动的时候就是一个driver。

job

一个Action操作就会触发一次job

sparkContext

客户端程序启动时候的核心。启动的时候会初始化TaskScheduler,SchedulerBackend,DAGScheduler三大组件

DAG

spark会在执行job的时候首先构建DAG图(有向无环图),根据DAG来调度task。

Task

一般情况下RDD的一个分区就会生成一个task。具体执行作业的对象。

TaskScheduler

具体调度task的调度器。

DAGScheduler

具体调度DAG的调度器,生成DAG图

SchedulerBackend

调度Executor执行,和CoarseGrainExecutorBackend进行通信。

相关文章

  • Spark核心原理,组件介绍

    standalone模式 master 负责集群资源的管理,主要负责worker的注册,driver的注册 wor...

  • scala基础语法

    Spark核心编程wordcount程序原理深度剖析图 Spark核心编程Spark架构原理

  • Spark核心编程:Spark基本工作原理与RDD

    Spark核心编程:Spark基本工作原理与RDD Spark基本工作原理 画图讲解Spark的基本工作原理1、分...

  • Spark内核解析

    Spark内核概述 Spark内核泛指Spark的核心运行机制,包括Spark核心组件的运行机制、Spark任务调...

  • Spark 内核概述

    Spark内核泛指Spark的核心运行机制,包括Spark核心组件的运行机制、Spark任务调度机制、Spark内...

  • 分布式数据库

    分布式架构分布式核心组件:hdfs , hbase newsql spark spanner 介绍。分布式文件...

  • 10 Spark Streaming

    Spark Streaming 第一:Spark Streaming基本原理 Spark Streaming的核心...

  • Spark内核分析之SparkContext初始化源码分析

    上一篇介绍了spark作业提交的三种方式,从本篇开始逐一介绍Spark作业运行流程中各个组件的内部工作原理。如标题...

  • 小结-Spark-Spark Streaming入门

    定义及工作原理 Spark Streaming定义,官网翻译如下 Spark Streaming是核心Spark ...

  • Spark-内核概述

    Spark核心组件 Driver Spark Driver节点用于执行Spark应用中的main方法,负责代码的实...

网友评论

      本文标题:Spark核心原理,组件介绍

      本文链接:https://www.haomeiwen.com/subject/jstskctx.html