美文网首页我爱编程
Hadoop集群下线datanode

Hadoop集群下线datanode

作者: invincine | 来源:发表于2018-08-08 18:58 被阅读0次

说明:最近需要把hadoop集群中的几台datanode拿出来另作它用,记录一下下线操作

datanode下线后可以直接关掉nodemanager进程,resourcemanager会将任务分配给其他节点


操作:

1.在hdfs-site.xml中增加以下参数:

<property>

    <name>dfs.hosts.exclude</name>

    <value>/hadoop/hadoop-2.6.0-cdh5.4.1/etc/hadoop/excludes</value>

<property>

2.在namenode节点对应路径下创建相关文件,并写入需要下线节点的IP地址

echo "192.168.127.3" >>  /hadoop/hadoop-2.6.0-cdh5.4.1/etc/hadoop/excludes

3.在namenode节点执行命令

hdfs dfsadmin -refreshNodes

4.查看下线情况

hdfs dfsadmin -report

Decomissioning标记的即为正在下线的datanode,hadoop集群会将下线的datanode数据块复制到其他节点

复制完成之后会变成Decommission Status : Decommissioned,此时可以下线此datanode

Decomission效率:5台服务器,每台大概7个T数据,用时大概16hour

平均5*7/16,约2.2T/hour

5.下线完成后,修改slave配置文件,去掉下线的机器

相关文章

网友评论

    本文标题:Hadoop集群下线datanode

    本文链接:https://www.haomeiwen.com/subject/xjwxbftx.html