大数据平台Hadoop的分布式集群环境搭建

大数据平台Hadoop的分布式集群环境搭建

作者: 4bfeaf8c2970 | 来源:发表于2019-05-07 14:19 被阅读5次

大数据平台Hadoop的分布式集群环境搭建

1 概述

本文章介绍大数据平台Hadoop的分布式环境搭建、以下为Hadoop节点的部署图，将NameNode部署在master1，SecondaryNameNode部署在master2，slave1、slave2、slave3中分别部署一个DataNode节点

NN=NameNode（名称节点）

SND=SecondaryNameNode（NameNode的辅助节点）

DN=DataNode（数据节点）

2 前期准备

（1）准备五台服务器

如：master1、master2、slave1、slave2、slave3

（2）关闭所有服务器的防火墙

$systemctl stop firewalld$ systemctldisablefirewalld

（3）分别修改各服务器的/etc/hosts文件，内容如下：

192.168.56.132master1192.168.56.133master2192.168.56.134slave1192.168.56.135slave2192.168.56.136slave3

注：对应修改个服务器的/etc/hostname文件，分别为 master1、master2、slave1、slave2、slave3

（4）分别在各台服务器创建一个普通用户与组

$ groupadd hadoop #增加新用户组$ useradd hadoop -m -g hadoop #增加新用户$ passwd hadoop #修改hadoop用户的密码

切换至hadoop用户：su hadoop

（5）各服务器间的免密码登录配置，分别在各自服务中执行一次

$ ssh-keygen -t rsa#一直按回车，会生成公私钥$ ssh-copy-id hadoop@master1 #拷贝公钥到master1服务器$ ssh-copy-id hadoop@master2 #拷贝公钥到master2服务器$ ssh-copy-id hadoop@slave1 #拷贝公钥到slave1服务器$ ssh-copy-id hadoop@slave2 #拷贝公钥到slave2服务器$ ssh-copy-id hadoop@slave3 #拷贝公钥到slave3服务器

注：以上操作需要登录到hadoop用户操作

（6）下载hadoop包，hadoop-2.7.5.tar.gz

官网地址：https://archive.apache.org/dist/hadoop/common/hadoop-2.7.5/

3 开始安装部署

（1）创建hadoop安装目录

$ mkdir -p/home/hadoop/app/hadoop/{tmp,hdfs/{data,name}}

（2）将安装包解压至/home/hadoop/app/hadoop下

$tarzxf tar -zxf hadoop-2.7.5.tar.gz-C /home/hadoop/app/hadoop

（3）配置hadoop的环境变量，修改/etc/profile

JAVA_HOME=/usr/java/jdk1.8.0_131JRE_HOME=/usr/java/jdk1.8.0_131/jreHADOOP_HOME=/home/hadoop/app/hadoop/hadoop-2.7.5PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbinexport PATH

（4）刷新环境变量

$source/etc/profile

4 配置Hadoop

（1）配置core-site.xml

$ vi/home/hadoop/app/hadoop/hadoop-2.7.5/etc/hadoop/core-site.xml

fs.defaultFShdfs://master1:9000hadoop.tmp.dir/home/hadoop/app/hadoop/tmp

默认配置地址：http://hadoop.apache.org/docs/r2.7.5/hadoop-project-dist/hadoop-common/core-default.xml

（2）配置hdfs-site.xml

$ vi/home/hadoop/app/hadoop/hadoop-2.7.5/etc/hadoop/hdfs-site.xml

dfs.replication3dfs.namenode.name.dir/home/hadoop/app/hadoop/hdfs/namedfs.datanode.data.dir/home/hadoop/app/hadoop/hdfs/datadfs.permissions.enabledfalsedfs.namenode.secondary.http-addressmaster2:50090

默认配置地址：http://hadoop.apache.org/docs/r2.7.5/hadoop-project-dist/hadoop-hdfs/hdfs-default.xml

（3）配置mapred-site.xml

$ cp/home/hadoop/app/hadoop/hadoop-2.7.5/etc/hadoop/mapred-site.xml.template/home/hadoop/app/hadoop/hadoop-2.7.5/etc/hadoop/mapred-site.xml$ vi/home/hadoop/app/hadoop/hadoop-2.7.5/etc/hadoop/mapred-site.xml

mapreduce.framework.nameyarn

默认配置地址：http://hadoop.apache.org/docs/r2.7.5/hadoop-mapreduce-client/hadoop-mapreduce-client-core/mapred-default.xml

（4）配置yarn-site.xml

$ vi/home/hadoop/app/hadoop/hadoop-2.7.5/etc/hadoop/yarn-site.xml

yarn.nodemanager.aux-servicesmapreduce_shuffleyarn.resourcemanager.hostnamemaster1yarn.resourcemanager.addressmaster1:8032yarn.resourcemanager.webapp.addressmaster1:8088

默认配置地址：http://hadoop.apache.org/docs/r2.7.5/hadoop-yarn/hadoop-yarn-common/yarn-default.xml

（5）配置slaves

$ vi/home/hadoop/app/hadoop/hadoop-2.7.5/etc/hadoop/slaves

slave1slave2slave3

slaves文件中配置的是DataNode的所在节点服务

（6）配置hadoop-env

修改hadoop-env.sh文件的JAVA_HOME环境变量，操作如下：

$ vi/home/hadoop/app/hadoop/hadoop-2.7.5/etc/hadoop/hadoop-env.sh

exportJAVA_HOME=/usr/java/jdk1.8.0_131

（7）配置yarn-env

修改yarn-env.sh文件的JAVA_HOME环境变量，操作如下：

$ vi/home/hadoop/app/hadoop/hadoop-2.7.5/etc/hadoop/yarn-env.sh

exportJAVA_HOME=/usr/java/jdk1.8.0_131

（8）配置mapred-env

修改mapred-env.sh文件的JAVA_HOME环境变量，操作如下：

$ vi/home/hadoop/app/hadoop/hadoop-2.7.5/etc/hadoop/mapred-env.sh

exportJAVA_HOME=/usr/java/jdk1.8.0_131

（9）将master1中配置好的hadoop分别远程拷贝至maser2、slave1 、slave2、slave3服务器中

$ scp -r /home/hadoop/app/hadoop hadoop@master2:/home/hadoop/app/$ scp -r /home/hadoop/app/hadoop hadoop@slave1:/home/hadoop/app/$ scp -r /home/hadoop/app/hadoop hadoop@slave2:/home/hadoop/app/$ scp -r /home/hadoop/app/hadoop hadoop@slave3:/home/hadoop/app/

5 启动测试

（1）在master1节点中初始化Hadoop集群

$ hadoop namenode -format

（2）启动Hadoop集群

$start-dfs.sh$start-yarn.sh

（3）验证集群是否成功

浏览器中访问50070的端口，如下证明集群部署成功

相关文章

网友评论

本文标题：大数据平台Hadoop的分布式集群环境搭建

本文链接：https://www.haomeiwen.com/subject/jdmeoqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

Java 杂谈

Spring-Boot

关于我们|服务条款|联系我们|大数据平台Hadoop的分布式集群环境搭建|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！