美文网首页大数据程序员我爱编程
大数据||hadoop分布式集群安装

大数据||hadoop分布式集群安装

作者: 明明德撩码 | 来源:发表于2018-02-22 08:00 被阅读58次

集群前先计划虚拟机,看文章大数据||Hadoop分布式部署虚拟机

  • 基于伪分布式环境安装进行展开
    规划机器与服务(★★★★☆)
    HDFS 文件系统
    YARN “云操作系统”
    JobHistoryServer 历史服务监控
  • 修改配置文件,设置服务运行机器节点(★★★☆☆)
  • 分发HADOOP安装包至各个机器节点
  • 依据官方集群安装文档,分别启动各节点相应服务
  • 测试 HDFS 、YARN、 MapReduce ,Web UI 监控集群(★★★☆☆)
  • 配置主节点至各从节点 SSH 无密钥登陆
  • 集群基准测试(实际环境必须的,面试题)

系统基本环境配置

规划机器与服务

copy 伪分布模式步骤
image.png
配置hdfs
  • 配置jdk。


  • 配置hdfs的nameNode地址



  • 配置hadoop数据存储目录及垃圾回收时间

创建hadoop数据存储目录 mkdir -p /opt/app/hadoop-2.5.0/data/tmp


  • 配置secondaryNameNode

vi /opt/app/hadoop-2.5.0/etc/hadoop/hdfs-site.xml

  • 配置集群 slaves

vi /opt/app/hadoop-2.5.0/etc/hadoop/slaves


yarn配置
  • yarn的环境变量配置 。

vi /opt/app/hadoop-2.5.0/etc/hadoop/yarn-env.sh


  • resourceManager配置

vi /opt/app/hadoop-2.5.0/etc/hadoop/yarn-site.xml


  • 配置集群slaves

vi /opt/app/hadoop-2.5.0/etc/hadoop/slaves


配置MapReduce
  • mapReduce环境变量

vi /opt/app/hadoop-2.5.0/etc/hadoop/mapred-env.sh


  • 配置jobhistoryserver

vi /opt/app/hadoop-2.5.0/etc/hadoop/mapred-site.xml


分发Hadoop安装包至各个机器节点

  • 首先删除doc文件,此文件夹不需要分发


  • 从主节点(131)到从节点(132,133)无密码登入及测试


ssh-copy-id hadoop-senior02.beifeng.com
ssh-copy-id hadoop-senior03.beifeng.com
说明:ssh-copy-id命令可以把本地主机的公钥复制到远程主机的authorized_keys文件上,ssh-copy-id命令也会给远程主机的用户主目录(home)和~/.ssh, 和~/.ssh/authorized_keys设置合适的权限


  • 分发hadoop安装包到子节点(132,133node节点)

命令scp(ssh copy)
scp -r ./hadoop-2.5.0 root@hadoop-senior02.beifeng.com:/opt/app/
scp -r ./hadoop-2.5.0 root@hadoop-senior03.beifeng.com:/opt/app/

yarn(132)无密码登入

  • 删除复制过来的虚拟机


  • 两个linux机器之间使用ssh不需要用户名和密码

命令:ssh-keygen -t rsa 。

两个linux机器之间使用ssh不需要用户名和密码,采用了数字签名RSA或者DSA来完成这个操作
  • 公钥复制到远程主机的authorized_keys文件上

ssh-copy-id hadoop-senior02.beifeng.com
ssh-copy-id hadoop-senior.beifeng.com
ssh-copy-id hadoop-senior03.beifeng.com


image.png

相关文章

  • Spark的安装及配置

    1 安装说明 在安装spark之前,需要安装hadoop集群环境,如果没有可以查看:Hadoop分布式集群的搭建 ...

  • Hive的安装及配置

    1 安装说明 在安装hive之前,需要安装hadoop集群环境,如果没有可以查看:Hadoop分布式集群的搭建 1...

  • Hadoop分布式集群搭建

    Hadoop分布式集群和前面的伪分布式安装方法类似,Hadoop用户创建,ssh配置,java环境安装,Hadoo...

  • 大数据与Hadoop 、 分布式文件系统 、 分布式Hadoop

    Hadoop Hadoop分布式集群 单机安装部署 购买云主机 主机IP地址配置hadoop1192.168.1....

  • Hadoop安装指南

    hadoop单机/伪分布式安装指导链接: hadoop集群安装 HDFS学习资源: HDFS入门 Hbase学习资...

  • 一致性hash

    应用领域(数据分布式存储) 数据缓存集群(redis、memcache) hadoop ESearch 分布式数据...

  • 第三节 阿里云下Hadoop分布式集群安装

    【Hadoop大数据基础】## 第三节 Hadoop分布式集群安装 3.1. 环境准备: 3台阿里云服务器: 10...

  • 建立伪分布式hbase集群

    建立伪分布式hbase集群 目标 建立hadoop伪分布式集群,挂载主机目录做为数据目录,暴露9000端口做为数据...

  • Hadoop知识点总结

    1. 什么是Hadoop 大数据处理的分布式系统 2. Hadoop****生态圈 三大核心: HDFS集群:分布...

  • linux安装hive 2.3.4

    1. 安装hadoop 详细请参见本人的另外一片文章《Hadoop 2.7.3 分布式集群安装》 2. 安装mys...

网友评论

    本文标题:大数据||hadoop分布式集群安装

    本文链接:https://www.haomeiwen.com/subject/bkeatftx.html