美文网首页Hadoop
黑猴子的家:Hadoop 完全分布式部署

黑猴子的家:Hadoop 完全分布式部署

作者: 黑猴子的家 | 来源:发表于2018-09-05 13:11 被阅读78次
1、SSH免密登录
$https://www.jianshu.com/p/2e7b920ce353
2、集群部署规划
"" node1 node2 node3
HDFS NameNode "" SecondaryNameNode
"" DataNode DataNode DataNode
YARN "" ResourceManager ""
"" NodeManager NodeManager NodeManager
3、基本配置文件

core-site.xml

<!-- 指定HDFS中NameNode的地址 -->
<property>
    <name>fs.defaultFS</name>
    <value>hdfs://node1:9000</value>
</property>

<!-- 指定hadoop运行时产生文件的存储目录 -->
<property>
    <name>hadoop.tmp.dir</name>
    <value>/opt/module/hadoop-2.8.2/data/tmp</value>
</property>

hadoop-env.sh

export JAVA_HOME=/opt/module/jdk1.8.0_144
export HADOOP_LOG_DIR=/opt/module/hadoop/logs

hdfs-site.xml

<!-- 指定HDFS副本的数量 -->
<property>
    <name>dfs.replication</name>
    <value>3</value>
</property>
<!-- 指定secondarynamenode位置 -->
<property>
    <name>dfs.namenode.secondary.http-address</name>
    <value>node3:50090</value>
</property>

slaves

node1
node2
node3
尖叫提示: 必须手写保证没有空格,首次编辑用vim编辑器防止出现乱码

yarn-env.sh

export JAVA_HOME=/opt/module/jdk1.8.0_144
export YARN_LOG_DIR=/opt/module/hadoop/logs

yarn-site.xml

<!-- reducer获取数据的方式 -->
<property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
</property>

<!-- 指定YARN的ResourceManager的地址 -->
<property>
    <name>yarn.resourcemanager.hostname</name>
    <value>node2</value>
</property>

mapred-env.sh

export JAVA_HOME=/opt/module/jdk1.8.0_144

mapred-site.xml

<!-- 指定mr运行在yarn上 -->
<property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
</property>
4、在集群上分发以上所有文件
[victor@node1 ~]$ cd /opt/module/hadoop-2.8.2/  
[victor@node1 hadoop-2.8.2]$ pwd
/opt/module/hadoop-2.8.2
[victor@node1 hadoop-2.8.2]$ rsync -rvl etc/hadoop/* victor@node2:/opt/module/hadoop-2.8.2/etc/hadoop/
[victor@node1 hadoop-2.8.2]$ rsync -rvl etc/hadoop/* victor@node3:/opt/module/hadoop-2.8.2/etc/hadoop/
5、查看文件分发情况
[victor@node3 hadoop-2.8.2]$ cat etc/hadoop/slaves
注意:查看每台机器的slaves
6、集群启动

(1) 如果集群是第一次启动,需要格式化namenode

[victor@node1 hadoop-2.8.2]$ bin/hdfs namenode -format

(2) 启动HDFS

[victor@node1 hadoop-2.8.2]$ sbin/start-dfs.sh

(3) 查看

[victor@node1 hadoop-2.8.2]$ jps
4163 NameNode
4484 Jps
4213 DataNode

[victor@node2 hadoop-2.8.2]$ jps
3268 DataNode
3298 Jps

[victor@node2 hadoop-2.8.2]$ jps
3321 DataNode
3383 SecondaryNameNode
3564 Jps

(4) 启动yarn

[victor@node2 hadoop-2.8.2]$ sbin/start-yarn.sh
注意:Namenode和ResourceManger如果不是同一台机器,不能在NameNode所在机器上启动 yarn,应该在ResouceManager所在的机器上启动yarn。
7、基本性能测试
$https://www.jianshu.com/p/1c2ad4dcac9a

相关文章

网友评论

    本文标题:黑猴子的家:Hadoop 完全分布式部署

    本文链接:https://www.haomeiwen.com/subject/qokawftx.html