美文网首页
Hadoop安装配置之伪分布模式安装

Hadoop安装配置之伪分布模式安装

作者: 程序员小华 | 来源:发表于2019-07-08 22:39 被阅读0次

    Hadoop安装部署方式有三种,在这里介绍其中一种安装部署方式——伪分布模式。主要的特点是:在单机上,模拟一个分布式的环境,具备Hadoop的所有功能,即Hadoop伪分布模式包含以下组件:
    HDFS:NameNode + DataNode + SecondaryNameNode
    Yarn:ResourceManager + NodeManager

    1.准备环境
    • 系统环境: rhel-server-7.4-x86_64
    • JDK环境:jdk-8u144-linux-x64.tar.gz
    • Hadoop:hadoop-2.7.3.tar.gz
      安装前的准备环境,假设已经在电脑上安装了 rhel-server-7.4-x86_64系统,并且已经配置好JDK环境变量,在/etc/hosts文件上配置系统主机名为 bigdata111,最后并且关闭了系统的防火墙
    [root@bigdata111 etc]# java -version
    java version "1.8.0_144"
    Java(TM) SE Runtime Environment (build 1.8.0_144-b01)
    Java HotSpot(TM) 64-Bit Server VM (build 25.144-b01, mixed mode)
    [root@bigdata111 etc]# cat /etc/hosts
    127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
    ::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
    192.168.220.111 bigdata111
    [root@bigdata111 etc]# systemctl status firewalld.service
    ● firewalld.service - firewalld - dynamic firewall daemon
       Loaded: loaded (/usr/lib/systemd/system/firewalld.service; disabled; vendor preset: enabled)
       Active: inactive (dead)
         Docs: man:firewalld(1)
    [root@bigdata111 etc]#
    
    2. 安装步骤
    • 将hadoop-2.7.3.tar.gz上传到Linux系统中,并且使用tar解压
    [root@bigdata111 hadoop-2.7.3]# pwd
    /root/training/hadoop-2.7.3
    [root@bigdata111 hadoop-2.7.3]# ll
    total 108
    drwxr-xr-x. 2 root root   194 Aug 18  2016 bin
    drwxr-xr-x. 3 root root    20 Aug 18  2016 etc
    drwxr-xr-x. 2 root root   106 Aug 18  2016 include
    drwxr-xr-x. 3 root root    20 Aug 18  2016 lib
    drwxr-xr-x. 2 root root   239 Aug 18  2016 libexec
    -rw-r--r--. 1 root root 84854 Aug 18  2016 LICENSE.txt
    -rw-r--r--. 1 root root 14978 Aug 18  2016 NOTICE.txt
    -rw-r--r--. 1 root root  1366 Aug 18  2016 README.txt
    drwxr-xr-x. 2 root root  4096 Aug 18  2016 sbin
    drwxr-xr-x. 4 root root    31 Aug 18  2016 share
    [root@bigdata111 hadoop-2.7.3]# 
    
    • 修改 /root/training/hadoop-2.7.3/etc/hadoop/hadoop-env.sh文件,将JAVA_HOME设置为JDK安装路径
    export JAVA_HOME=/root/training/jdk1.8.0_144
    
    • 修改/root/training/hadoop-2.7.3/etc/hadoop/hdfs-site.xml,在文件中添加以下配置
    <!--配置数据块的冗余度,默认是3-->
    <!--原则冗余度跟数据节点个数保持一致,最大不要超过3-->
    <property>  
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    
    <!--是否开启HDFS的权限检查,默认是true-->
    <!--使用默认值,后面会改为false-->
    <!--
    <property>  
        <name>dfs.permissions</name>
        <value>false</value>
        </property>             
    -->     
    
    • 修改/root/training/hadoop-2.7.3/etc/hadoop/core-site.xml,在文件中添加以下配置
    <!--配置HDFS主节点的地址,就是NameNode的地址-->
    <!--9000是RPC通信的端口-->
    <property>  
        <name>fs.defaultFS</name>
        <value>hdfs://bigdata111:9000</value>
    </property> 
    
    <!--HDFS数据块和元信息保存在操作系统的目录位置-->
    <!--默认是Linux的tmp目录,一定要修改-->
    <property>  
        <name>hadoop.tmp.dir</name>
        <value>/root/training/hadoop-2.7.3/tmp</value>
    </property>
    

    在该步骤,要先在目录/root/training/hadoop-2.7.3下通过mkdir命令创建tmp目录

    • 修改/root/training/hadoop-2.7.3/etc/hadoop/mapred-site.xml(注意:mapred-site.xml文件默认不存在,可以通过在该目录下的mapred-site.xml.template复制然后重命名得到),添加以下配置:
    <!--MR程序运行容器或者框架-->
    <property>  
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property> 
    
    • 修改/root/training/hadoop-2.7.3/etc/hadoop/yarn-site.xml,添加以下配置:
    <!--配置Yarn主节点的位置-->
    <property>  
        <name>yarn.resourcemanager.hostname</name>
        <value>bigdata111</value>
    </property>         
    
    <!--NodeManager执行MR任务的方式是Shuffle洗牌-->
    <property>  
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    
    • 对HDFS的NameNode进行格式化
      运行以下命令进行格式化:
    [root@bigdata111 hadoop]# hdfs namenode -format
    

    格式化命令运行后,出现以下日志信息代表格式化成功:



    格式化成功后,查看HDFS数据块和元信息保存目录/root/training/hadoop-2.7.3/tmp,发现出现以下信息:

    [root@bigdata111 tmp]# pwd
    /root/training/hadoop-2.7.3/tmp
    [root@bigdata111 tmp]# tree
    .
    └── dfs
        └── name
            └── current
                ├── fsimage_0000000000000000000
                ├── fsimage_0000000000000000000.md5
                ├── seen_txid
                └── VERSION
    
    3 directories, 4 files
    [root@bigdata111 tmp]# 
    
    • 启动Hadoop
      通过以下命令启动Hadoop,如果没有配置免密码登录,在启动过程中需要输入四次系统密码,
    start-all.sh
    

    启动成功后,通过Web页面访问hdfs和yarn,hdfs的端口号是: 50070,yarn的端口号是:8088,如下所示:


    HDFS Web页面
    Yarn Web页面

    通过JPS查看JAVA进程可以发现Hadoop有5个组件已经启动:

    [root@bigdata111 tmp]# jps
    37552 ResourceManager
    37242 DataNode
    37115 NameNode
    37403 SecondaryNameNode
    37837 NodeManager
    38015 Jps
    [root@bigdata111 tmp]# 
    

    至此,Hadoop伪分布模式安装部署成功。

    3. Hadoop启动和停止命令
    • 启动命令:
    HDFS:start-dfs.sh
    Yarn: start-yarn.sh
    同时启动HDFS和Yarn:start-all.sh
    
    • 停止命令:
    关闭HDFS和Yarn:stop-all.sh
    

    相关文章

      网友评论

          本文标题:Hadoop安装配置之伪分布模式安装

          本文链接:https://www.haomeiwen.com/subject/wudzhctx.html