hadoop的搭建笔记2-完全分布式搭建

作者: 一花一叶异世界 | 来源:发表于2018-02-27 13:56 被阅读0次

HBase学习笔记二：全分布式搭建
hadoop集群环境搭建之完全分布式集群环境搭建（二）
hadoop的搭建笔记2-完全分布式搭建
Hadoop2.9.0+VMware+ubuntu16.04完全
hadoop一小时搞定单机搭建
hadoop 集群
HBase: HMaster服务自动停止，且关闭集群时HRegi
搭建Hadoop-HA环境
Hadoop实战（3）_虚拟机搭建CDH的全分布模式
Hadoop实战（7）_Apache Hadoop安装和配置Hu

分三步走：
一、机器的规划

屏幕快照 2018-02-27 13.56.08.png

datanode 和nodemanager每台机器都搭配一个作为数据存储，一个数据分析
领导者：一号机分配namenode
二号机 resourcemanager
三号机secondarymanager
一号机多一个historyserver

规划好以后就开始搭建，不在之前的伪分布式里面进行了，这里重新建一个app文件夹来进行

屏幕快照 2018-02-27 14.03.10.png

二、搭建
分三小步：1.前期准备
2.修改那三个-env.sh文件
3.修改相关的 -site.xml文件

开始：
解压到app目录下，然后删除share下的doc

屏幕快照 2018-02-27 14.09.07.png

修改的三个文件：

![屏幕快照 2018-02-27 14.12.41.png](https://img.haomeiwen.com/i417433/036b2185200e9054.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

1· hadoop-env.sh
2· yarn-env.sh
3· mapred-env.sh文件

配置上java 的路径
export JAVA_HOME="java的解压路径"

然后是修改四个-site.xml文件请参考《hadoop的搭建笔记》那里

屏幕快照 2018-02-27 14.19.03.png

1.core-site.xml
2.hdfs-site.xml
3.yarn-site.xml
4.mapred-site.xml

1.core-site.xml：

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://lyanmei001:8020</value> //一个默认的入口
</property>
<property>
<name>hadoop.tmp.dir</name> //缓存目录
<value>/opt/moduels/hadoop-2.5.0/data/tmp</value> //没有这个目录需要去先把这个目录建好
</property>
</configuration>

所以先退出回来建缓存文件夹

屏幕快照 2018-02-27 14.40.13.png

2.hdfs-site.xml
<property>
<name>dfs.replication</name> //待定应该如图配置的是权限是否开启
<value>1</value>
</property>
<property>
<name>dfs.namenode.secondary.http-address</name> //secondarynamenode的配置
<value>yanmei003:50090</value> //放到的三号机上面
</property>

屏幕快照 2018-02-27 14.45.47.png

3.mapred-site.xml

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

<property>       //历史服务器  在一号机上  所以要加上
    <name>mapreduce.jobhistory.address</name>
    <value>yanmei001:10020</value>
</property>
<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>yanmei001:19888</value>
</property>

屏幕快照 2018-02-27 14.49.43.png

记得改mapred-site.xml的名字
用mv 移动的时候就可以改名了

屏幕快照 2018-02-27 14.52.37.png

4.yarn-site.xml

屏幕快照 2018-02-27 14.54.19.png

<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>yanmei002</value>
</property>

<property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>
<property>
<name>yarn.log-aggregation.retain-seconds</name> //缓存时间
<value>604800</value>
</property>
</configuration>

解释点：
<property>
<name>yarn.resourcemanager.hostname</name> //resourcemanager 在2号机器上 yanmei002
<value>yanmei002</value>
</property>

到这搭建就完成了，不过只是在一号机器上搭建了，
其他机器怎么办了，两个方法：
1.去解压重复以上步骤
2.直接拷贝过去（先在个机器上建好存储拷贝内容的文件夹）

屏幕快照 2018-02-27 15.16.41.png

屏幕快照 2018-02-27 15.18.02.png

命令： scp -r hadoop-2.5.0/ yanmei002:/opt/app //2号机器

scp -r hadoop-2.5.0/ yanmei003:/opt/app //3号机器

完了以后记得格式化namenode

bin/hdfs namenode -format
查看data/tmp文件

屏幕快照 2018-02-27 15.23.58.png

第三步、启动各个进程
按照机器规划来启动各个进程
启动hadoop类型：
sbin/hadoop-daemon.sh start namenode
sbin/hadoop-daemon.sh start datanode
sbin/hadoop-daemon.sh start secondarynamenode
启动yarn：
sbin/yarn-daemon.sh start resourcemanager
sbin/yarn-daemon.sh start nodemanager
启动历史服务器：
启动：sbin/mr-jobhistory-daemon.sh start historyserver
关闭命令：
sbin/mr-jobhistory-daemon.sh stop historyserver