美文网首页大数据玩转大数据程序员
Hadoop单点安装(伪分布式)

Hadoop单点安装(伪分布式)

作者: 木木与呆呆 | 来源:发表于2018-05-10 22:39 被阅读28次

Hadoop单点安装,基于版本2.7.1,
在一台Lunix主机上面安装Hdoop,
包括Hdfs的NameNode和DataNode,
以及Yarn的ResouceManager和NodeManager。

1.安装规划

vi /etc/hosts
10.43.159.7 zdh-7
useradd -g hadoop -s /bin/csh -md /home/hdfsone hdfsone
hdfsone/zdh1234

2.配置文件

登陆hdfsone用户,
安装jdk,修改.bashrc文件,配置jdk目录:

export JAVA_HOME=/usr/java/jdk1.8.0_151
export PATH=$PATH:$JAVA_HOME/bin
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

配置hadoop的安装目录:

export HADOOP_HOME=/home/hdfsone/hadoop-2.7.1
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

3.配置ssh,实现免密登陆

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
必须修改权限,否则无法免秘登陆
chmod 600 ~/.ssh/authorized_keys
验证无密码登陆
ssh localhost
注意,本步骤单机也需要配置的,在启动脚本中会用到相应的功能。

4.安装rsync

使用如下命令查看是否已经安装,一般都有:
type rsync

5.解压hadoop

tar -zxvf hadoop-2.7.1.tar.gz

6.配置伪分布模式

修改etc/hadoop/core-site.xml如下:

<property>
<name>fs.defaultFS</name>
<value>hdfs://10.43.159.7:9000</value>
</property>

修改etc/hadoop/hdfs-site.xml如下:

<property>
<name>dfs.replication</name>
<value>1</value>
</property>

<property>
    <name>dfs.namenode.name.dir</name>
    <value>file:/home/hdfsone/dfs/name</value>
</property>

<property>
    <name>dfs.datanode.data.dir</name>
    <value>file:/home/hdfsone/dfs/data</value>
</property>

<property>
  <name>dfs.namenode.rpc-address</name>
  <value>10.43.159.7:9000</value>
  <description>
    RPC address that handles all clients requests. In the case of HA/Federation where multiple namenodes exist,
    the name service id is added to the name e.g. dfs.namenode.rpc-address.ns1
    dfs.namenode.rpc-address.EXAMPLENAMESERVICE
    The value of this property will take the form of nn-host1:rpc-port.
  </description>
</property>

<property>
  <name>dfs.namenode.secondary.http-address</name>
   <value>10.43.159.7:40090</value>
   <description>
        The secondary namenode http server address and port.
   </description>
</property>

注意:core-site.xml的fs.defaultFS的端口要和hdfs-site.xml的dfs.namenode.rpc-address一致,以rpc配置的端口开启监听

7.初始化并且启动hdfs

格式化namenode,修改完配置后执行:
hdfs namenode -format
dfs/name等目录不存在会自动新建

启动hdfs服务:
start-dfs.sh
停止hdfs服务:
stop-dfs.sh

hdfs的web管理页面:
http://10.43.159.7:50070
hdfs服务地址:
hdfs://10.43.159.7:9000

查看namenodes节点:
hdfs getconf -namenodes

8.配置yarn

cp mapred-site.xml.template mapred-site.xml

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

yarn-site.xml

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>

启动yarn服务:
start-yarn.sh
停止yarn服务:
stop-yarn.sh

yarn的web管理页面:
http://10.43.159.7:8088/

9.验证hdfs安装

创建目录
hadoop fs -mkdir /user
列出根目录
hadoop fs -ls /

10.验证yarn安装

后台执行mapreduce任务,可以在yarn的web管理页面查看到:
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount input/wordcount /user/wordresult

11.参考文章

http://www.aboutyun.com/thread-12798-1-1.html

相关文章

  • Hadoop单点安装(伪分布式)

    Hadoop单点安装,基于版本2.7.1,在一台Lunix主机上面安装Hdoop,包括Hdfs的NameNode和...

  • hadoop成长笔记

    [2018/08/07]1. 伪分布集群的安装 介绍:Hadoop三种运行模式安装:Hadoop(二)搭建伪分布式...

  • Hadoop分布式集群搭建

    Hadoop分布式集群和前面的伪分布式安装方法类似,Hadoop用户创建,ssh配置,java环境安装,Hadoo...

  • hadoop+hbase 伪分布式安装

    基本环境及软件: java基础环境和hadoop为分布式安装请点击,跳转至"hadoop+spark 伪分布式安装...

  • Hadoop安装指南

    hadoop单机/伪分布式安装指导链接: hadoop集群安装 HDFS学习资源: HDFS入门 Hbase学习资...

  • Hadoop相关文章索引(3)

    环境部署 hadoop-2.7.0.tar.gz hadoop 2.6.0单节点-伪分布式模式安装 hadoop2...

  • Hive1.2.2安装[hadoop伪分布式中]

    一、安装Hadoop 学习Hive首先需要有Hadoop环境,可参考 请参考:hadoop搭建[单机模式+伪分布式...

  • 大数据-索引

    Hadoop体系 hadoop-01-伪分布式安装[https://www.jianshu.com/p/ee917...

  • hadoop集群配置-总结

    [TOC] hadoop 集群 hadoop3.2 分为 单点,集群 ,伪集群 hadoop 配置 hadoop ...

  • 伪分布式Hadoop搭建

    伪分布式Hadoop搭建 hadoop的安装 下载Hadoop压缩文件这里使用清华的镜像wget http://m...

网友评论

    本文标题:Hadoop单点安装(伪分布式)

    本文链接:https://www.haomeiwen.com/subject/ujxxdftx.html