美文网首页
Spark基本概念

Spark基本概念

作者: ryancao_b9b9 | 来源:发表于2020-05-04 15:39 被阅读0次
术语 含义
Application 用户编写的Spark应用程序,包括一个Driver和多个executors
Application jar 包含用户程序的Jar包
Driver Program 运行main()函数并创建SparkContext进程
Cluster manager 在集群上获取资源的外部服务,如standalone manager,yarn,Mesos
deploy mode 部署模式,区别在于driver process运行的位置
worker node 集群中可以运行程序代码的节点(机器)
Executor 运行在worker node上执行具体的计算任务,存储数据的进程
Task 被分配到一个Executor上的计算单元
Job 由多个任务组成的并行计算阶段,因RDD的Action产生
Stage 每个Job被分为小的计算任务组,每组称为一个stage
DAGScheduler 根据Job构建基于Stage的DAG,并提交Stage给TaskScheduler
TaskScheduler 将TaskSet提交给worker运行,每个executor运行什么task在此分配

相关文章

  • 2018-10-10

    spark基本概念 spark基结构 目前Spark由四部分 构成 :Spark SQL、MLlib、Graph ...

  • Spark系列1 - Spark生态和RDD

    1 Spark的生态 Spark Core中的基本概念 DAG(Directed Acyclic Graph), ...

  • Spark 以及 spark streaming 核心原理及实践

    本文依次从spark生态,原理,基本概念,spark streaming原理及实践,还有spark调优以及环境搭建...

  • Spark的基本术语

    Spark作业的基本概念 Application:用户自定义的Spark程序,用户提交后,Spark为App分配资...

  • spark streaming 初步

    一 基本概念 streaming的重要特点是使用了spark DataFrame spark streami...

  • Spark SQL

    目录一.Spark SQL基础1.Spark SQL简介2.Spark SQL的特点:3.基本概念:表:Datas...

  • Spark基本概念

    Spark基本概念 Application 用户在 spark 上构建的程序,包含了 driver 程序以及在集群...

  • spark运行流程

    spark中基本概念 Application:表示你的应用程序 Driver:表示main()函数,创建Spark...

  • Spark SQL:基础

    目录一.Spark SQL简介二.Spark SQL的特点三.基本概念:表:(Datasets或DataFrame...

  • spark2原理分析-广播变量(Broadcast Variab

    概述本文介绍spark中Broadcast Variables的实现原理。 基本概念在spark中广播变量属于共享...

网友评论

      本文标题:Spark基本概念

      本文链接:https://www.haomeiwen.com/subject/aicyghtx.html