YARN是主要负责资源调度。之前已经搭建好了Hadoop集群,接下来在集群上启动YARN。
1. 配置YARN并启动
1. 配置集群
1.1 配置yarn-env.sh文件
export JAVA_HOME=你的jkd安装路径
1.2 配置yarn-site.xml文件
<!-- 指定Reduce获取数据的方式-->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<!-- 指定YARN的ResourceManager的地址-->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>腾讯云服务器的内网ip</value>
</property>
1.3 配置mapred-env.sh文件
export JAVA_HOME=你的jkd安装路径
1.4 将mapred-sit.xml.template重新命名为mapred-site.xml并配置
<!-- 指定MapReduce运行在Yarn上-->
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
2. 启动集群
2.1 启动前必须保证NameNode和DataNode已经启动
2.2 启动ResourceManager
$ sbin/yarn-daemon.sh start resourcemanager
2.3 启动NodeManager
$ sbin/yarn-daemon.sh start nodemanager
3. 查看启动结果
3.1 使用jps
查看ResourceManager和NodeManager是否启动
3.2 在浏览器中输入腾讯云公网IP:8088
进行查看,如果出现以下界面表示启动成功:
2. 在YARN上运行MapReduce程序
1. 删除HDFS上的outptu目录
$ bin/hdfs dfs -rm -r /user/hadoop1/output
2. 运行WordCount案例
$ sbin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-x.x.x.jar wrodcount /user/hadoop1/input /user/hadoop1/output
3. 在刚才打开的页面中查看运行MR程序的详细信息
此时,我们点击页面中的history查看MR程序运行的详细信息时发现页面无法访问,这时因为没有配置历史服务,下面进行历史服务器配置。
3. 配置历史服务器
1. 修改mapred-site.xml文件
<!-- 历史服务器端地址-->
<property>
<name>mapreduce.jobhistory.address</name>
<value>服务器内网IP:10020</value>
</property>
<!-- 历史服务器web端地址-->
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>服务器内网IP:19888</value>
</property>
2. 启动历史服务器
$ sbin/mr-jobhistory-daemon.sh start historyserver
s
3. 使用jps
查看历史服务器是否启动
历史服务器已经启动,在浏览器中输入公网IP地址:19888/jobhistory
可以访问,但是在之前的页面中点击history时却无法访问,怀疑是访问路径出了问题。
直接访问:
点击history:
等后学学习过程中逐渐深入了解后,解决这个问题后再来说明,大家有解决办法的话可以分享给我,谢谢!!!
网友评论