美文网首页
新 Hadoop Yarn 框架原理及运作机制

新 Hadoop Yarn 框架原理及运作机制

作者: Summer_1981 | 来源:发表于2019-02-14 22:32 被阅读0次

从业界使用分布式系统的变化趋势和 hadoop 框架的长远发展来看,MapReduce 的 JobTracker/TaskTracker 机制需要大规模的调整来修复它在可扩展性,内存消耗,线程模型,可靠性和性能上的缺陷。在过去的几年中,hadoop 开发团队做了一些 bug 的修复,但是最近这些修复的成本越来越高,这表明对原框架做出改变的难度越来越大。

image

为从根本上解决旧 MapReduce 框架的性能瓶颈,促进 Hadoop 框架的更长远发展,从 0.23.0 版本开始,Hadoop 的 MapReduce 框架完全重构,发生了根本的变化。新的 Hadoop MapReduce 框架命名为 MapReduceV2 或者叫 Yarn,其架构图如下图所示:

image

新的 Hadoop MapReduce 框架(Yarn)架构

重构根本的思想是将 JobTracker 两个主要的功能分离成单独的组件,这两个功能是资源管理和任务调度 / 监控。新的资源管理器全局管理所有应用程序计算资源的分配,每一个应用的 ApplicationMaster 负责相应的调度和协调。一个应用程序无非是一个单独的传统的 MapReduce 任务或者是一个 DAG( 有向无环图 ) 任务。ResourceManager 和每一台机器的节点管理服务器能够管理用户在那台机器上的进程并能对计算进行组织。

事实上,每一个应用的 ApplicationMaster 是一个详细的框架库,它结合从 ResourceManager 获得的资源和 NodeManager 协同工作来运行和监控任务。

上图中 ResourceManager 支持分层级的应用队列,这些队列享有集群一定比例的资源。从某种意义上讲它就是一个纯粹的调度器,它在执行过程中不对应用进行监控和状态跟踪。同样,它也不能重启因应用失败或者硬件错误而运行失败的任务。

ResourceManager 是基于应用程序对资源的需求进行调度的 ; 每一个应用程序需要不同类型的资源因此就需要不同的容器。资源包括:内存,CPU,磁盘,网络等等。可以看出,这同现 Mapreduce 固定类型的资源使用模型有显著区别,它给集群的使用带来负面的影响。资源管理器提供一个调度策略的插件,它负责将集群资源分配给多个队列和应用程序。调度插件可以基于现有的能力调度和公平调度模型。

上图中 NodeManager 是每一台机器框架的代理,是执行应用程序的容器,监控应用程序的资源使用情况 (CPU,内存,硬盘,网络 ) 并且向调度器汇报。

每一个应用的 ApplicationMaster 的职责有:向调度器索要适当的资源容器,运行任务,跟踪应用程序的状态和监控它们的进程,处理任务的失败原因。

相关文章

  • 新 Hadoop Yarn 框架原理及运作机制

    从业界使用分布式系统的变化趋势和 hadoop 框架的长远发展来看,MapReduce 的 JobTracker/...

  • Hadoop HA 高可用原理及部署

    一:概述 Hadoop HA机制原理,主要分为NameNode HA以及Yarn HA。 Hadoop HA环境搭...

  • 2020-03-20

    Hadoop框架中的Yarn机制 流程 1.Client提交任务 2.ResourceManager创建Appli...

  • MR作业提交流程分析

    Hadoop 2.x引入了一种新的执行机制。这种新机制(MR 2)建立在一个名为YARN的系统上。而用于执行的框架...

  • Yarn~新的 map-reduce 框架

    Hadoop 新 MapReduce 框架 Yarn 详解 - zero516cn - 博客园http://www...

  • Yarn~新的 map-reduce 框架

    Hadoop 新 MapReduce 框架 Yarn 详解 - zero516cn - 博客园http://www...

  • Yarn

    Yarn本质及机制 Yarn是一个资源管理和调度的框架.主要进程包括:ResourceManager,NodeMa...

  • 看过的好的博客

    Spark BlockManager原理与源码分析yarn的框架及原理Spark数据倾斜的完美解决SparkSQL...

  • Hadoop

    狭义 Hadoop HDFS MapReduce Yarn 资源调度 广义 Hadoop辅助框架 flume 日志...

  • yarn原理详解

    一、Yarn简介 Yarn是Hadoop集群的资源管理系统。Hadoop2.0对MapReduce框架做了彻底的设...

网友评论

      本文标题:新 Hadoop Yarn 框架原理及运作机制

      本文链接:https://www.haomeiwen.com/subject/eyfueqtx.html