美文网首页
Hadoop-3.2.2(HA)完全分布式部署

Hadoop-3.2.2(HA)完全分布式部署

作者: haopink | 来源:发表于2021-03-10 16:07 被阅读0次

1、环境准备

  • 安装jdk配置环境变量 /etc/hosts等信息
  • ssh免密登录
  • 关闭防火墙
    检查防火墙状态(如果active(running)那么关闭)
    systemctl status firewalld
    service iptables status
    临时关闭防火墙
    systemctl stop firewalld
    service iptables stop
    永久关闭防火墙
    systemctl disable firewalld
    chkconfig iptables off

2、集群规划

目前使用5台机器、相关的角色分配如下

hadoop1101 hadoop1102 hadoop1103 hadoop1104 hadoop1105
zk zk zk - -
NameNode NameNode NameNode - -
zkfc zkfc zkfc - -
- - JournalNode JournalNode JournalNode
DataNode DataNode DataNode DataNode DataNode
- - - ResourceManager ResourceManager
NodeManager NodeManager NodeManager NodeManager NodeManager

3 配置Zookeeper集群

  • 下载zookeeper
  • tar -xvf apache-zookeeper-3.6.2-bin.tar.gz -C /opt/(可换成安装目录我安装在/opt下面)
  • 进入安装目录(apache-zookeeper-3.6.2-bin/conf) cp zoo_sample.cfg zoo.cfg 编辑zoo.cfg
image.png

YARN-HA配置

1)、配置 yarn-site.xml,并分发到各个节点上

<configuration>
<property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>

    <!-- 启用resourcemanager ha -->
    <property>
        <name>yarn.resourcemanager.ha.enabled</name>
        <value>true</value>
    </property>

    <!-- 声明2台resourcemanager的地址 -->
    <property>
        <name>yarn.resourcemanager.cluster-id</name>
        <value>cluster-yarn1</value>
    </property>
    <!--指定resourcemanager的逻辑列表-->
    <property>
        <name>yarn.resourcemanager.ha.rm-ids</name>
        <value>rm1,rm2</value>
    </property>

<!-- ========== rm1的配置 ========== -->
    <!-- 指定rm1的主机名 -->
        <property>
            <name>yarn.resourcemanager.hostname.rm1</name>
            <value>hadoop1104</value>
    </property>
    <!-- 指定rm1的web端地址 -->
    <property>
         <name>yarn.resourcemanager.webapp.address.rm1</name>
         <value>hadoop1104:8088</value>
    </property>
    <!-- 指定rm1的内部通信地址 -->
    <property>
         <name>yarn.resourcemanager.address.rm1</name>
         <value>hadoop1104:8032</value>
    </property>
    <!-- 指定AM向rm1申请资源的地址 -->
    <property>
         <name>yarn.resourcemanager.scheduler.address.rm1</name>
         <value>hadoop1104:8030</value>
    </property>
    <!-- 指定供NM连接的地址 -->
    <property>
         <name>yarn.resourcemanager.resource-tracker.address.rm1</name>
         <value>hadoop1104:8031</value>
    </property>
<!-- ========== rm2的配置 ========== -->
    <!-- 指定rm2的主机名 -->
    <property>
        <name>yarn.resourcemanager.hostname.rm2</name>
        <value>hadoop1105</value>
    </property>
    <property>
         <name>yarn.resourcemanager.webapp.address.rm2</name>
         <value>hadoop1105:8088</value>
    </property>
    <property>
         <name>yarn.resourcemanager.address.rm2</name>
         <value>hadoop1105:8032</value>
    </property>
    <property>
         <name>yarn.resourcemanager.scheduler.address.rm2</name>
         <value>hadoop1105:8030</value>
    </property>
    <property>
         <name>yarn.resourcemanager.resource-tracker.address.rm2</name>
         <value>hadoop1105:8031</value>
    </property>

    <!-- 指定zookeeper集群的地址 -->
    <property>
        <name>yarn.resourcemanager.zk-address</name>
        <value>hadoop1101:2181,hadoop1102:2181,hadoop1103:2181</value>
    </property>

    <!-- 启用自动恢复 -->
    <property>
        <name>yarn.resourcemanager.recovery.enabled</name>
        <value>true</value>
    </property>

    <!-- 指定resourcemanager的状态信息存储在zookeeper集群 -->
    <property>
        <name>yarn.resourcemanager.store.class</name>
        <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
    </property>
<!-- 环境变量的继承 -->
 <property>
        <name>yarn.nodemanager.env-whitelist</name>
 <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
 </property>
<!-- Site specific YARN configuration properties -->

</configuration>
  1. 、开启yarn
    start-yarn.sh

8088端口查看服务

image.png

相关文章

  • Hadoop-3.2.2(HA)完全分布式部署

    1、环境准备 安装jdk配置环境变量 /etc/hosts等信息 ssh免密登录 关闭防火墙检查防火墙状态(如果a...

  • hadoop-2.7.7 HA完全分布式集群部署详解

    1.Hadoop HA简介及工作原理 Hadoop NameNode官方开始支持HA集群默认是从2.0开始,之前的...

  • HBase组件部署-单节点

    注意伪分布式不等同与单机模式! 1.需要安装好jdk ![[Hadoop平台搭建-集群部署-HA#3 jdk的安装...

  • 2019-02-28-rancher HA 部署

    参考:Rancher Server HA的高可用部署实验 概述 本次部署使用了三台机器: Rancher_HA1:...

  • hadoop基本环境搭建

    hadoop基本环境搭建 linux配置本地模式伪分部模式完全分布式HA架构启动方式基准测试 clouder版本说...

  • Hadoop 集群搭建

      hadoop集群搭建分为多种,如伪分布式,分布式,HA,Federation等,这里着重介绍下HA和Feder...

  • 完全分布式部署Hadoop

    基本流程:准备3台客户机(关闭防火墙、静态ip、主机名称)安装jdk配置环境变量安装hadoop配置环境变量ssh...

  • Hadoop完全分布式部署

    一、概述 概念: 是一个可靠的、可伸缩的、分布式计算的开源软件。是一个框架,允许跨越计算机集群的大数据及分布式处理...

  • hadoop 完全分布式部署

    Hdaoop 完全分布式部署 标签(空格分隔):Hdaoop 一、集群环境 系统版本 Centos6.8 base...

  • Spark | 集群部署

    Spark伪分布式部署 环境准备 java安装、ssh无密码登陆 spark部署 客户端访问 Spark完全分布部...

网友评论

      本文标题:Hadoop-3.2.2(HA)完全分布式部署

      本文链接:https://www.haomeiwen.com/subject/navwqltx.html