YARN学习第一课

作者: V_6619 | 来源:发表于2021-11-11 11:13 被阅读0次

产生背景

  MapRdeuce1.x 存在问题

image.png

master/slave：JobTracker / TashTracker
问题：
JobTracker：单点，如果挂掉了就会整个崩掉
想扩展的话，jobTracker是一个瓶颈
仅仅只能够支持mapreduce作业，

资源利用率 &运维成本
所有的计算框架运行在一个集群中，共享一个集群的资源，做到按需分配

催生了YARN的诞生

image.png

YARN概述

https://hadoop.apache.org/docs/stable/hadoop-yarn/hadoop-yarn-site/YARN.html

Yet Another Resource Negotiator
通用的资源管理系统
1. job scheduling
2. monitoring
为上层应用提供统一的资源管理和调度

YARN架构
Clinet、ResourceManager、NodeManager 、ApplicationMaster、
Master / slave

Clinet: 向RM提交任务、杀死任务等
ApplicationMaster：
i 每个应用程序对应一个AM
ii AM 向RM申请资源用于在NM上启动对应的Task
iii 数据切分
iv 为每个task向RM申请资源（container），与NodeManager通信
v 任务的监控

NodeManager：多个
i 干活（计算）
ii 向RM发送心跳信息、任务的执行情况、启动任务
iii 处理来自AM的命令，

ResourceManager：集群中同一时刻对外提供服务的只有一个，负责资源相关
i 处理来自客户端的请求：提交 / 杀死
ii 启动 / 监控AM
iii 监控NM

container：任务的运行抽象（memory、cpu）
i task是运行在container里面的，可以运行am、也可以运行map、reduce 等

image.png

启动yarn
https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html

提交：

cd /home/hadoop/app/hadoop-2.6.0-cdh5.15.1/share/hadoop/mapreduce
hadoop jar hadoop-mapreduce-examples-2.6.0-cdh5.15.1.jar pi 2 3

提交自己开发的作业到YARN上运行的步骤：

1 mvn clean package -DskinTests 
2 把编译出来的jar包以及测试数据上传到服务器
scp

3 把数据上传到HDFS
hadoop fs -put xxx

4 执行作业
hadoop jar xxx.jar 包名+类名 args...

5 到YARN UI（8088）上去观察作业的运行情况

6 到输出目录去查看对应的输出情况

网友评论

本文标题：YARN学习第一课

本文链接：https://www.haomeiwen.com/subject/dtjuzltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

YARN学习第一课

产生背景

YARN概述

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读