美文网首页
Hadoop搭建

Hadoop搭建

作者: d6a12a231881 | 来源:发表于2017-11-03 10:42 被阅读0次

配置ssh免密登陆

前提:master和slave节点配置相同。

本环境中已默认安装了SSH服务,所以我们只需要对其进行配置即可。

1、生成密钥命令:

ssh-keygen -P ""

image

在/root/.ssh目录下可以看到有authorized_keys、id_rsa、id_rsa.pub三个文件

cd /root/.ssh

ls

image

2、将master的公钥id_rsa.pub复制到master、slave1、slave2的authorized_keys里面,这样就可以让master免密钥登录到master、slave1、slave2。

首先对master自身做免密,如下

ssh-copy-id root@images.handge.cn

image image

测试ssh连接到master

ssh master

image

测试完毕,退出连接使用exit命令。

image

使用同样的方法让master节点能够免密登录到slave1、和slave2。

ssh-copy-id root@192.168.1.3

ssh-copy-id root@192.168.1.4

安装hadoop

1、切换到hadoop压缩包所在位置,解压文件

cd /opt

tar -zxvf /opt/hadoop-2.7.3.tar.gz -C /opt

image

2、配置环境变量

编辑/etc/profile文件,在PATH参数后面追加hadoop路径

vim /etc/profile

编辑如下:

<pre class="md-fences md-end-block" lang="" contenteditable="false" cid="n92" mdtype="fences" style="box-sizing: border-box; overflow: visible; font-family: Consolas, "Liberation Mono", Courier, monospace; font-size: 0.9em; white-space: pre; display: block; break-inside: avoid; text-align: left; background-image: ; background-position: var(--code-block-bg-color); background-size: ; background-repeat: var(--code-block-bg-color); background-attachment: ; background-origin: ; background-clip: ; background-color: rgb(248, 248, 248); position: relative !important; border: 1px solid rgb(221, 221, 221); border-radius: 3px; padding: 8px 1em 6px; margin-bottom: 15px; margin-top: 15px; width: inherit; color: rgb(51, 51, 51); font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: 2; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;">

export JAVA_HOME=/opt/jdk1.8.0_111

export PATH=PATH:/opt/hadoop-2.7.3/bin:/opt/hadoop-2.7.3/sbin

export CLASSPATH=.:JAVA_HOME/lib/tools.jar

</pre>

image

使配置文件生效

source /etc/profile

![image](https://img.haomeiwen.com/i3517338/099caa0f07e165d9.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1

3、配置分布式环境

集群/分布式模式需要修改

/opt/hadoop-2.7.3/etc/hadoop中的七个配置文件,slaves、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml、hadoop-env.sh、yarn-env.sh,其中文件

mapred-site.xml (需要先重命名,默认文件名为 mapred-site.xml.template)

切换到/opt/hadoop-2.7.3/etc/hadoop目录下

cd /opt/hadoop-2.7.3/etc/hadoop

ls

image

重命名mapred-site.xml.template为mapred-site.xml

mv mapred-site.xml.template mapred-site.xml

image

ls

image

3.1、文件 slaves,将作为 DataNode 的主机名写入该文件,每行一个,默认为

localhost,分布式配置可以保留 localhost,也可以删掉,让 Master 节点仅作为

NameNode 使用。 这里让 master 节点仅作为 NameNode 使用,因此将文件中原来的

localhost 删除,添加两行内容:Slave1和Slave2。

编辑slaves文件

vim slaves

编辑如下:

<pre class="md-fences md-end-block" lang="" contenteditable="false" cid="n136" mdtype="fences" style="box-sizing: border-box; overflow: visible; font-family: Consolas, "Liberation Mono", Courier, monospace; font-size: 0.9em; white-space: pre; display: block; break-inside: avoid; text-align: left; background-image: ; background-position: var(--code-block-bg-color); background-size: ; background-repeat: var(--code-block-bg-color); background-attachment: ; background-origin: ; background-clip: ; background-color: rgb(248, 248, 248); position: relative !important; border: 1px solid rgb(221, 221, 221); border-radius: 3px; padding: 8px 1em 6px; margin-bottom: 15px; margin-top: 15px; width: inherit; color: rgb(51, 51, 51); font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: 2; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;">

slave1

slave2

</pre>

image

3.2、编辑文件 core-site.xml,改为下面的配置

vim core-site.xml

配置文件编辑如下:

<pre class="md-fences md-end-block" lang="" contenteditable="false" cid="n144" mdtype="fences" style="box-sizing: border-box; overflow: visible; font-family: Consolas, "Liberation Mono", Courier, monospace; font-size: 0.9em; white-space: pre; display: block; break-inside: avoid; text-align: left; background-image: ; background-position: var(--code-block-bg-color); background-size: ; background-repeat: var(--code-block-bg-color); background-attachment: ; background-origin: ; background-clip: ; background-color: rgb(248, 248, 248); position: relative !important; border: 1px solid rgb(221, 221, 221); border-radius: 3px; padding: 8px 1em 6px; margin-bottom: 15px; margin-top: 15px; width: inherit; color: rgb(51, 51, 51); font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: 2; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;">

<configuration>

<property>

<name>fs.defaultFS</name>

<value>hdfs://master:9000</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>/opt/tmp</value>

</property>

</configuration>

</pre>

image

3.3、编辑文件 hdfs-site.xml,其中dfs.replication 一般设为 3吧 ,但我们有两个

Slave 节点,所以 dfs.replication 的值还是设为 2。

vim hdfs-site.xml

配置文件编辑如下

<pre class="md-fences md-end-block" lang="" contenteditable="false" cid="n155" mdtype="fences" style="box-sizing: border-box; overflow: visible; font-family: Consolas, "Liberation Mono", Courier, monospace; font-size: 0.9em; white-space: pre; display: block; break-inside: avoid; text-align: left; background-image: ; background-position: var(--code-block-bg-color); background-size: ; background-repeat: var(--code-block-bg-color); background-attachment: ; background-origin: ; background-clip: ; background-color: rgb(248, 248, 248); position: relative !important; border: 1px solid rgb(221, 221, 221); border-radius: 3px; padding: 8px 1em 6px; margin-bottom: 15px; margin-top: 15px; width: inherit; color: rgb(51, 51, 51); font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: 2; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;">

<configuration>

<property>

<name>dfs.namenode.secondary.http-address</name>

<value>master:9001</value>

</property>

<property>

<name>dfs.replication</name>

<value>2</value>

</property>

<property>

<name>dfs.namenode.name.dir</name>

<value>/opt/dfs/name</value>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>/opt/dfs/data</value>

</property>

</configuration>

</pre>

image

3.4、编辑文件 yarn-site.xml

vim yarn-site.xml

<pre class="md-fences md-end-block" lang="" contenteditable="false" cid="n162" mdtype="fences" style="box-sizing: border-box; overflow: visible; font-family: Consolas, "Liberation Mono", Courier, monospace; font-size: 0.9em; white-space: pre; display: block; break-inside: avoid; text-align: left; background-image: ; background-position: var(--code-block-bg-color); background-size: ; background-repeat: var(--code-block-bg-color); background-attachment: ; background-origin: ; background-clip: ; background-color: rgb(248, 248, 248); position: relative !important; border: 1px solid rgb(221, 221, 221); border-radius: 3px; padding: 8px 1em 6px; margin-bottom: 15px; margin-top: 15px; width: inherit; color: rgb(51, 51, 51); font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: 2; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;">

<configuration>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<property>

<name>yarn.resourcemanager.hostname</name>

<value>master</value>

</property>

</configuration>

</pre>

image

3.5、编辑文件 mapred-site.xml

vim mapred-site.xml

<pre class="md-fences md-end-block" lang="" contenteditable="false" cid="n169" mdtype="fences" style="box-sizing: border-box; overflow: visible; font-family: Consolas, "Liberation Mono", Courier, monospace; font-size: 0.9em; white-space: pre; display: block; break-inside: avoid; text-align: left; background-image: ; background-position: var(--code-block-bg-color); background-size: ; background-repeat: var(--code-block-bg-color); background-attachment: ; background-origin: ; background-clip: ; background-color: rgb(248, 248, 248); position: relative !important; border: 1px solid rgb(221, 221, 221); border-radius: 3px; padding: 8px 1em 6px; margin-bottom: 15px; margin-top: 15px; width: inherit; color: rgb(51, 51, 51); font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: 2; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;">

<configuration>

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

<final>true</final>

</property>

<property>

<name>mapreduce.jobhistory.address</name>

<value>master:10020</value>

</property>

<property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>master:19888</value>

</property>

</configuration>

</pre>

image

3.6、修改hadoop-env.sh文件下面java的路径

vim hadoop-env.sh

配置文件编辑如下:

export JAVA_HOME=/opt/jdk1.8.0_111

image

3.7、修改yarn-env.sh文件,修改JAVA_HOME值

vim yarn-env.sh

配置文件编辑如下:

export JAVA_HOME=/opt/jdk1.8.0_111

image

前提:安装hadoop时,master和slave节点配置文件完全相同,这里介绍了master的安装及配置。Slave可以通过手动配置,配置时请参考master,也可通过scp命令将master配置文件拷贝到slave的相同目录下,如:

scp -r /opt/hadoop-2.7.3 root@slave1:/opt

scp -r /opt/hadoop-2.7.3 root@slave2:/opt

将master节点的配置文件拷贝到slave节点,其中 scp -r 表示拷贝目录。

启动hadoop

前提:启动hadoop时,在master节点上面启动。

1、第一次启动需要在master的hadooop安装目录(/opt/hadoop-2.7.3)下执行format。

cd /opt/hadoop-2.7.3

./bin/hdfs namenode -format

image

2、启动hadoop命令,在master的hadooop安装目录的sbin(/opt/hadoop-2.7.3/sbin)下执行。

cd /opt/hadoop-2.7.3/sbin/

ls

image

2.1、启动命令

start-all.sh

image

jps查看集群进程

在hadoop集群开启的状态下,执行jps命令查看集群相关进程是否已完全启动。

  • master节点:

  • 启动验证,master节点上应该有4个进程,分别是Jps、NameNode、SecondaryNameNode、ResourceManager,则表示master节点上面启动hadoop成功。

jps

image
  • Slave1节点:

  • 启动验证,slave1节点上应该有3个进程,分别是Jps、DataNode、NodeManager。

jps

image
  • Slave2节点:

  • 启动验证,slave1节点上应该有3个进程,分别是Jps、DataNode、NodeManager。

jps

image

浏览器访问hadoop

1、打开desktop节点

,登录之后(密码为123456),在浏览器上面输入

http://images.handge.cn:50070

,可以查看hadoop集群的概况。注:这里的images.handge.cn是主节点的IP,50070是NameNode默认的端口号。

image

2、打开desktop节点

,登录之后在浏览器上面输入

http://images.handge.cn:8088

,查看hadoop集群中节点的情况。注:这里的images.handge.cn是主节点的IP,8088是默认的ResourceManager的端口号。

image

3、在hadoop集群的概况页面中,点击上方菜单栏里面的Datanodes,可以查看Datanode的详细信息。

image

eclipse配置

说明:Eclipse的配置需要在Desktop节点上,登录默认的密码是123456。

  • 安装插件

  • eclipse想要运行在hadoop集群上,需要安装hadoop-eclipse-plugin插件。首先需要将/opt目录下的hadoop-eclipse-plugin-2.6.0.jar包复制到eclipse的目录的plugins下面。

    1、登录之后,在左边菜单栏点击终端图标,如下:

    image

    1.1、在终端切换到root

    su

    image

    1.2、将/opt目录下的hadoop-eclipse-plugin-2.6.0.jar包复制到eclipse的目录的plugins下。

    scp /opt/hadoop-eclipse-plugin-2.6.0.jar /opt/eclipse/plugins

    image
  • 环境配置

1、启动eclipse,切换到eclipse所在的目录下,这里的目录为(/opt/eclipse)

cd /opt/eclipse

ls

image

1.2、启动eclipse

./eclipse

image

2、点击上方菜单栏里面的“window->Preferences”, 点击Preferences。

2.1、在搜索框中输入hadoop,选择“Hadoop Map/Reduce”。

2.2、点击“浏览”添加hadoop的安装目录(这里的安装目录为:/opt/hadoop-2.7.3)。

image image

2.3、点击“Apply”应用。 2.4、点击“OK”。

image

3、在界面左边的“Project Explorer”显示出“DFS

Location”,在上方菜单栏点击“window->Open
Perspective->Other”,在弹出框选择“MapReduce栏”,最后点击“OK”。在界面下方会显示如下界面:

image

4、新建一个Location:鼠标右键点击空白区域。如下图:

image

5、编辑新建的Location。如下图:

image

编辑新建的Location,需要注意一下几点:

(a)、Location name 是你为所创建的Location的命名,可以任意填写。

(b)、Map/Reduce(V2)

Master区域,有两个参数需要配置,Host和Port,其中,Host为主节点的hostname或者IP,Port是jobtracker的端口号,这里使用9001。

(c)、DFS

Master区域,同样有两个参数要配置,Host和Port,其中,Host默认和Map/Reduce(V2)

Master区域的Host相同,不需要做更改,Port处需要填写与core-site.xml文件里面的端口,这里填写9000。

6、配置完毕之后,点击“Finish”。在界面下方会出现新建的Location。如下图:

image

在界面左侧的Project

Explorer中,则会出现相应的文件夹。(由于最开始没有建文件夹,因此这里显示为0)。如下图:

image

到这里,eclipse在hadoop-2.7.3上面的搭建已经完成。用户就可以使用Eclipse环境在hadoop集群上进行开发。

停止hadoop

执行停止命令,即:

stop-all.sh

相关文章

网友评论

      本文标题:Hadoop搭建

      本文链接:https://www.haomeiwen.com/subject/ovozpxtx.html