Spark学习笔记一

作者: BitGuo | 来源:发表于2019-10-28 15:29 被阅读0次

Spark 集群架构

架构图如下:


spark-集群模式

图中出现了以下几个实体:

  • ApplicationSpark的应用程序,由集群上的一个Driver结点和多个Executor组成。

  • Driver Porgram:客户端上的主应用程序,该进程运行主函数方法,在主函数中创建Spark执行的上下文即SaprkContext

  • Cluster Manager:集群资源管理器,比如YARN就是一种Cluster Manager。目前的资源管理器有以下几种:

    • Standalone:Spark的原生管理器
    • Hadoop Yarn:由Yarn中的ResourceManager负责资源管理
    • Mesos:由Mesos中的Mesos Master负责资源的管理
  • WorkerNode:从属节点,类似hadoop中的datanode,是负责执行作业的计算任务的工作节点。

  • Executor:在 WorkerNode上的工作进程,负责执行计算任务并将输出数据保存到内存或磁盘。

  • Task: 由Driver programme发送到 WorkerNode的作业的工作单元。

图中的方向箭头表示了一个作业被执行的过程:

  • 用户程序创建SparkContext,它于Cluster Manager通信,申请计算作业需要的资源,Cluster Manager随之为用户程序分配计算所需资源,并启动在Worker Node上的Executor进程。

  • Driver Programme将一个大作业划分为了多个执行阶段,每个阶段都有Task,之后将Task发送给 Worker Node上的Executor执行。

  • Executor执行task并且向Driver发送执行报告。同时也向Cluster Manager反馈资源使用情况。

相关文章

  • spark

    *Spark Spark 函数Spark (Python版) 零基础学习笔记(一)—— 快速入门 1.map与fl...

  • spark 学习笔记

    Spark学习笔记 Data Source->Kafka->Spark Streaming->Parquet->S...

  • Spark Core 学习笔记

    Spark Core 学习笔记 1、Spark 简介 ​ Spark 是一种用于大规模数据处理的统一计算引擎...

  • 2020-03-17

    spark学习笔记centos安装Oracle VirtualBox: Centos安装Vagrant

  • spark核心编程

    Spark 学习笔记 Spark 架构及组件 client:客户端进程,负责提交job到master Driver...

  • Spark学习笔记一

    Spark 集群架构 架构图如下: 图中出现了以下几个实体: Application :Spark的应用程序,由集...

  • Spark Architecture

    OReilly.Learning.Spark 学习笔记 Spark里所有操作都是对RDD来的。分为两种 1. Tr...

  • 《架构师训练营》之大数据应用

    极客时间《架构师训练营》第十三周学习笔记 Spark 架构 Spark 则是 UC Berkeley AMP la...

  • 【Spark学习笔记】初识spark

    1.Spark简介 快速且通用的集群计算平台 1.1.快速性: Spark扩充了流行的mapreduce计算模型 ...

  • Spark学习笔记

    Scala语法 至于scala语法而言,大致上和Java的语法类似,增加了一些函数式编程,具体语法可以参考Scal...

网友评论

    本文标题:Spark学习笔记一

    本文链接:https://www.haomeiwen.com/subject/wzcbvctx.html