配置ssh免密码登录——集群学习日记

作者: Kwongtai | 来源:发表于2017-07-25 11:41 被阅读0次

前言

因为比赛的限制是使用Hadoop2.7.2，估在此文章下面的也是使用Hadoop2.7.2,具体下载地址为Hadoop2.7.2

开始的准备

目前在我的实验室上有三台Linux主机，因为需要参加一个关于spark数据分析的比赛，所以眼见那几台服务器没有人用，我们团队就拿来配置成集群。具体打算配置如下的集群

主机名	IP地址（内网）
SparkMaster	10.21.32.106
SparkWorker1	10.21.32.109
SparkWorker2	10.21.32.112

首先进行的是ssh免密码登录的操作

具体操作在上一篇学习日记当中已经写到了，在此不再详细说。

配置Java环境

因为我那三台电脑也是配置好了JDK了，所以在此也不详细说。
配置好Java的机子可以使用

java -version

来查看Java的版本

下载Hadoop2.7.2

因为我最后的文件是放在/usr/local下面的，所以我也直接打开/usr/local文件夹下。直接

wget https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.7.2/hadoop-2.7.2.tar.gz

安装Hadoop以及配置Hadoop环境

解压

tar -zxvf hadoop-2.7.2.tar.gz

删除

rm -rf hadoop-2.7.2.tar.gz

解压删除之后打开hadoop-2.7.2文件夹，在etc/hadoop/hadoop-env.sh中配置JDK的信息
先查看本机的jdk目录地址在哪里

echo $JAVA_HOME

vi etc/hadoop/hadoop-env.sh

将

export JAVA_HOME=${JAVA_HOME}

改为

export JAVA_HOME=/usr/java/jdk1.8.0_131

为了方便我们以后开机之后可以立刻使用到Hadoop的bin目录下的相关命令，可以把hadoop文件夹下的bin和sbin目录配置到/etc/profile文件中。

vi /etc/profile

添加

export PATH=$PATH:/usr/local/hadoop-2.7.2/bin:/usr/local/hadoop-2.7.7/sbin

按一下esc,按着shift+两次z键保存

使用

source  /etc/profile

使得命令配置信息生效,是否生效可以通过

hadoop version

查看

配置Hadoop分布式集群

前言

考虑是为了建立spark集群，所以主机命名为SparkMaster SparkWorker1 SparkWorker2

修改主机名

vi /etc/hostname

修改里面的名字为SprakMaster,按一下esc,按着shift+两次z键保存。

设置hosts文件使得主机名和IP地址对应关系

vi /etc/hosts

Ps:其他两台slave的主机也修改对应的SparkWorker1 SparkWorker2，如果修改完主机名字之后户籍的名字没有生效，那么重启系统便可以。三台机子的hostname与hosts均要修改

PS：变量dfs.replication指定了每个HDFS数据块的复制次数，即HDFS存储文件的副本个数.我的实验环境只有一台Master和两台Worker（DataNode），所以修改为2。

配置yarn-site.xml

vi etc/hadoop/yarn-site.xml

具体配置如下：

<configuration>
        <property>
               <name>yarn.nodemanager.aux-services</name>
               <value>mapreduce_shuffle</value>
        </property>
        <property>
               <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
               <value>org.apache.hadoop.mapred.ShuffleHandler</value>
        </property>
        <property>
               <name>yarn.resourcemanager.address</name>
               <value>SparkMaster:8032</value>
       </property>
       <property>
               <name>yarn.resourcemanager.scheduler.address</name>
               <value>SparkMaster:8030</value>
       </property>
       <property>
               <name>yarn.resourcemanager.resource-tracker.address</name>
               <value>SparkMaster:8031</value>
       </property>
       <property>
               <name>yarn.resourcemanager.admin.address</name>
               <value>SparkMaster:8033</value>
       </property>
       <property>
               <name>yarn.resourcemanager.webapp.address</name>
               <value>SparkMaster:8088</value>
       </property>
</configuration>

将`SparkMaster`节点的`hadoop-2.7.2/etc/下面的文件通过以下方式放去其他节点

rsync -av /usr/local/hadoop-2.7.2/etc/ SparkWorker1:/usr/local/hadoop-2.7.2/etc/

rsync -av /usr/local/hadoop-2.7.2/etc/ SparkWorker1:/usr/local/hadoop-2.7.2/etc/

完成之后可以查看SparkWorker1、SparkWorker2下面的文件是否变了

启动hadoop分布式集群

在`SparkMaster`节点格式化集群的文件系统

输入

hadoop namenode -format

查看各个节点的进程信息

使用

jps

查看各节点的进程信息
可以看到

结言

到此Hadoop的分布式集群就搭好了。这个Spark运行的基础。

参见：CentOS 6.7安装Hadoop 2.7.2
++王家林/王雁军/王家虎的《Spark 核心源码分析与开发实战》++

文章出自kwongtai'blog，转载请标明出处！

网友评论

本文标题：配置ssh免密码登录——集群学习日记

本文链接：https://www.haomeiwen.com/subject/vidwkxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

配置ssh免密码登录——集群学习日记

前言

开始的准备

首先进行的是ssh免密码登录的操作

配置Java环境

下载Hadoop2.7.2

安装Hadoop以及配置Hadoop环境

配置Hadoop分布式集群

前言

修改主机名

设置hosts文件使得主机名和IP地址对应关系

配置yarn-site.xml

将`SparkMaster`节点的`hadoop-2.7.2/etc/下面的文件通过以下方式放去其他节点

启动hadoop分布式集群

在`SparkMaster`节点格式化集群的文件系统

查看各个节点的进程信息

结言

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

Linux

Linux学习之路

我用 Linux

配置ssh免密码登录——集群学习日记

前言

开始的准备

首先进行的是ssh免密码登录的操作

配置Java环境

下载Hadoop2.7.2

安装Hadoop以及配置Hadoop环境

配置Hadoop分布式集群

前言

修改主机名

设置hosts文件使得主机名和IP地址对应关系

配置yarn-site.xml

将SparkMaster节点的`hadoop-2.7.2/etc/下面的文件通过以下方式放去其他节点

启动hadoop分布式集群

在SparkMaster节点格式化集群的文件系统

查看各个节点的进程信息

结言

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

Linux

Linux学习之路

我用 Linux

将`SparkMaster`节点的`hadoop-2.7.2/etc/下面的文件通过以下方式放去其他节点

在`SparkMaster`节点格式化集群的文件系统