美文网首页
马士兵 day2_hdfs集群集中管理和hadoop文件操作

马士兵 day2_hdfs集群集中管理和hadoop文件操作

作者: PC_Repair | 来源:发表于2018-10-16 10:31 被阅读75次
day2_hdfs集群集中管理和hadoop文件操作

启动四台机器

  • master:hadoop-daemon.sh start namenode
  • slave:hadoop-daemon.sh start datanode

观察集群配置情况:

  • 终端查看:hdfs dfsadmin -report | more

  • 浏览器查看:http://192.168.56.100:50070

web界面观察集群运行情况:netstat -ntlp

关闭集群:hadoop-daemon.sh stop namenode hadoop-daemon.sh stop datanode

对集群进行集中管理 vim /usr/local/hadoop/etc/hadoop/slaves

# 删去了原有的localhost,不删估计也行
# 编辑内容如下
slave1
slave2
slave3

使用start-dfs.sh启动集群

  • 需要输入每个节点的密码,对slave进行远程登录

  • 在master上用ssh连接一台slave,需要输入密码slave的密码,ssh slave1,输入密码登陆成功后,使用exit指令退回到master。

免密ssh远程登录

  • 回到根目录 cd /root/.ssh
  • ls.ssh目录下的文件
  • 生成rsa算法的公钥和私钥 ssh-keygen -t rsa,进入 cd /root/.ssh可以看到以下文件生成
    • id_rsa私钥
    • id_rsa.pub公钥
  • 完成免密ssh登录:ssh-copy-id slaveX
    • 在slaveX机器的/root/.ssh目录下多出authorized_keys文件
  • 需要给本机也拷贝一份:ssh-copy-id master,因为本机执行也是远程登录
  • 使用stop-dfs.sh停止集群
  • start-dfs.sh测试免密登录是否成功

测试:

将hadoop的安装文件put到hadoop上的操作:hadoop fs -put ./hadoop-2.7.3.tar.gz /

  • 注意当前目录为 /usr/local/

  • vim /usr/local/hadoop/etc/hadoop/hdfs-site.xmlreplication属性修改为2

  • 为了方便测试,同时需要修改另外一个参数dfs.namenode.heartbeat.recheck-interval,这个值默认为300s,将其修改成10000,单位是ms,这个参数是定期间隔时间后检查slave的运行情况并更新slave的状态。

<configuration>
    <property>
        <name>dfs.replication</name>  
        <value>2</value>
    </property>
    <property>
        <name>dfs.namenode.heartbeat.recheck-interval</name>
        <value>10000</value>
   </property>
</configuration>
  • stop-dfs.sh

  • start-dfs.sh

  • 将jdk put到hadoop上:hadoop fs -put jdk.rmp /

  • 关闭slave3:hadoop-daemon.sh stop datanode

修改本机上的hosts文件,通过名字来访问集群web界面

  • vim /etc/hosts
# 编辑如下内容
192.168.56.100 master
192.168.56.101 slave1
192.168.56.102 slave2
192.168.56.103 slave3

相关文章

  • 马士兵 day2_hdfs集群集中管理和hadoop文件操作

    day2_hdfs集群集中管理和hadoop文件操作 启动四台机器 master:hadoop-daemon.sh...

  • 开发yarn应用程序

    前言 YARN是一个资源管理系统,负责集群资源的管理和分配。yarn就好比hadoop集群的操作系统,当用户向YA...

  • hadoop学习大纲

    Hadoop集群环境搭建 Hadoop集群环境搭建 HDFS 图说HDFS基本原理hadoop的shell命令操作...

  • Hadoop课程大纲

    Hadoop集群环境搭建 Hadoop集群环境搭建 HDFS 图说HDFS基本原理hadoop的shell命令操作...

  • Hadoop课程大纲

    Hadoop集群环境搭建 Hadoop集群环境搭建 HDFS 图说HDFS基本原理hadoop的shell命令操作...

  • Hadoop 课程大纲

    Hadoop集群环境搭建 Hadoop集群环境搭建 HDFS 图说HDFS基本原理hadoop的shell命令操作...

  • Hadoop-HDFS之CRUD

    启动集群 确认集群正常后,我们使用Java来操作DFS Java连接Hadoop Maven添加Hadoop依赖。...

  • HDFS读写和冷备份原理

    HDFS写文件流程 当用户通过命令行或者JavaAPI向Hadoop集群发起写入文件操作时,将触发写文件流程,分为...

  • 马士兵 day1_Hadoop集群搭建

    day1_Hadoop集群搭建 需要用到的软件 VirtualBox 5.1.30(版本之间有所差别) hadoo...

  • Hive压缩与配置

    优点 在Hadoop集群中,有大量的数据复制和移动操作,压缩过后可以减少文件的大小,从而可以减少磁盘和网络的I/O...

网友评论

      本文标题:马士兵 day2_hdfs集群集中管理和hadoop文件操作

      本文链接:https://www.haomeiwen.com/subject/xpiczftx.html