美文网首页
Yarn调度MapReduce

Yarn调度MapReduce

作者: 忆华灯纵博 | 来源:发表于2018-06-27 00:02 被阅读34次

当我们执行这条命令时:hadoop jar hadoop-mapreduce-examples-2.7.3.jar wordcount /input /output

hadoop为我们做了那些事情?

Yarn调度MapReduce程序的过程

yarn调度流程:

client端会调用resourcemanager,申请执行一个job

resourcemanager会给客户端返回一个hdfs的目录以及一个application_id号。

client端会将切片信息、job的配置信息以及jar包上传到上一步收到的hdfs目录下(三个文件分别是:job.split、job.xml、jar包)

client请求resourcemanager启动mrappmaster

resourcemanager将client请求初始化成一个task任务,放到执行队列里面(默认FIFO),当执行到这个task的时候会给该job分配资源。

resourcemanager会找空闲的nodemanager创建一个container容器,并启动mrappmaster

当mrappmaster启动之后会先将client提交hdfs的资源(job.split、job.xml、jar包)下载到本地

mrappmaster根据资源信息的情况请求resourcemanager启动maptask

resourcemanager会为上面的请求找空闲的nodemanager并创建maptask的container

mrappmaster将资源发送给各个nodemanager并且启动上面相应的maptask程序,监控maptask的运行情况(如果maptask挂掉之后,由mrappmaster去处理)。

当maptask执行完成后,mrappmaster又会向resourcemanager申请reducetask的资源

resourcemanager又会为上面的请求找空闲的nodemanager并创建reducetask的container

mrappmaster然后又启动reducetask任务,并且监控reducetask任务的执行状况。

直到mapreduce的程序执行完成

整个job运行完毕后,mrAppMaster会向RM注销自己

相关文章

  • YARN配置

    YARN 是从 MapReduce 中分离出来的,负责资源管理与任务调度。YARN 运行于 MapReduce 之...

  • Yarn调度MapReduce

    当我们执行这条命令时:hadoop jar hadoop-mapreduce-examples-2.7.3.jar...

  • Hadoop

    狭义 Hadoop HDFS MapReduce Yarn 资源调度 广义 Hadoop辅助框架 flume 日志...

  • Hadoop之YARN

    YARN是从最早的MapReduce中抽取出来的资源管理调度平台,可以跑mapreduce、spark,Hadoo...

  • Hadoop 面试题

    hadoop组成? MapReduce 计算Yarn 资源调度hdfs 数据存储Common 辅助工具 如...

  • Hadoop:3、Hadoop伪分布式部署(MapReduce+

    MapReduce:计算 Yarn: 资源(CPU、内存等)调度和作业(程序)平台 修改mapred-site.x...

  • 简单的介绍Hadoop的基本结构和其组件功能

    HDFS:分布式文件系统MapReduce:分布式并行编程模型YARN:资源管理和调度器Tez:运行在YARN之上...

  • hadoop

    Hadoop构成 分布式存储HDFS 分布式计算MapReduce 资源调度引擎Yarn HDFS: 块级别的分布...

  • Hadoop的资源管理系统 —— Yarn

    一、背景和作用   Yarn 是 Hadoop 的资源管理系统,用于取代 MapReduce1 的资源调度,改善 ...

  • 07.YARN

    YARN 一、YARN概述 1). YARN产生背景 MapReduce1.x ==> MapReduce2.xm...

网友评论

      本文标题:Yarn调度MapReduce

      本文链接:https://www.haomeiwen.com/subject/mgxvyftx.html