Linux系统搭建hadoop高性能集群（一）

作者: JCLightZZ | 来源:发表于2020-11-04 23:14 被阅读0次

Linux系统搭建hadoop高性能集群（一）
Linux系统搭建hadoop高性能集群（二）
阿里腾讯云 hadoop+spark集群搭建（2）
阿里腾讯云 hadoop+spark集群搭建（1）
大数据Hadoop集群搭建-04安装配置HDFS
ZooKeeper集群搭建
hadoop集群环境搭建之伪分布式集群环境搭建（一）
Hadoop | Hadoop 环境搭建过程总结
hadoop学习大纲
Hadoop课程大纲

关于此篇（题外话）

目前，作者也还是一名默默无闻的大学生，之所以写这篇文章，主要是最近接到了不少朋友的求助，他们在搭建hadoop集群时，出现了不少的问题，以至于无法成功搭建。这里统一写一份部署教程，帮助一些读者朋友解决一些微不足道的问题，也将hadoop集群的搭建流程及错误处理作以留存。好了，废话不多说了，进入正题。

关于hadoop集群部署和相关软件的资料，可在相关资料一栏下，自行提取使用。

Linux系统搭建hadoop高性能集群（一）

第一步虚拟机的安装

这里不再详述，不会的小伙伴可以选择百度或CSDN下查找相应的安装方法。

第二步创建一个虚拟机

1、打开VMware软件，点击新建虚拟机，这里有两种方式。

第一种：在主界面上点击创建新的虚拟机

创建虚拟机
第二种：点击文件按钮在下拉菜单中选择新建虚拟机

创建虚拟机

进入安装向导后，使用默认安装方式，连续点击下一步直到进入“选择客户机操作系统”，选择Linux，版本选择CentOS 64位；点击下一步后，命名虚拟机并选择安装位置；点击下一步，配置虚拟机的处理器，这里需要根据主机的性能和虚拟机数量配置核数，通常为双核一个处理器；在虚拟机的内存配置中选择默认（推荐）；磁盘容量可选择默认也可自行更改。

虚拟机配置

注意：在创建过程中的ISO安装镜像，选择稍后安装，不要使用自动（简易）安装。

第三步虚拟机启动初始化

选中刚刚创建好的虚拟机，在CD/DVD(IDE)选项中，选中使用ISO镜像文件，将本机上的CentOS的ISO镜像文件路径填入文本框中，设置完成后，开启此虚拟机。进入系统安装界面后，选择第一条选项（Install or upgrade an existing system），引导驱动加载完成后，进入Disc Found界面，在此界面中选择skip后，选择系统使用的语言，选择完成后在存储设备警告界面选择yes...，设置主机名，设置网络配置，选择自动连接，选择时区，设置密码，在磁盘格式化界面单击将修改写入磁盘选项，单击Reboot，等待重启完成后即可。

网络配置

注意：这里只安装命令行界面，桌面可视化不需要安装。

第四步虚拟机克隆

将安装好系统的虚拟机关闭，右键单击虚拟机，选择克隆，因为我们的Hadoop集群需要分别设置namenode和datanode，所以这里需要根据个人主机的配置克隆虚拟机数量，这里我们克隆两台虚拟机，VMware提供了两种克隆方式，分别是完整克隆和链接克隆，这里我们使用完整克隆，在克隆虚拟机向导中为虚拟机命名，完成后等待片刻即可。

克隆虚拟机

第五步 Linux系统网络配置

IP地址配置

在虚拟机的编辑下点击虚拟网络编辑器，在VMnet8下获取管理员权限，更改VMnet8的DHCP设置，根据子网IP和子网掩码，设置起始IP地址和结束IP地址，点击确定后即可。

虚拟网络编辑器配置

进入本机以太网下，右键属性更改VMnet8的DNS配置和IP配置，IP地址设置必须和虚拟机网络的网关一致，DNS可选用8.8.8.8或114.114.114.114。

对应网卡配置

配置主机名和IP映射

修改完成后进入克隆好的第一个虚拟机hadoop02，在命令行界面输入如下命令，配置主机名。

$ vi /etc/sysconfig/network

在HOSTNAME一栏进行主机名配置（依据个人配置），这里将三台主机的主机名依次配置为hadoop01、hadoop02、hadoop03。

主机名配置完成后，配置IP映射，输入如下命令，配置IP映射。

$ vi /etc/hosts

注意：主机的IP地址要和主机名对应。

虚拟机网络配置

网络参数配置

输入如下命令，修改虚拟机网卡配置文件（配置该设备的MAC地址）

 $ vi /etc/udev/rules.d/70-persistent-net.rules

根据每台虚拟机的网络适配器高级设置中的MAC地址，配置该主机的MAC地址，该配置文件下的ATTR{address}就是该主机的MAC地址，由于克隆了两台虚拟机，所以在所克隆的虚拟机的网卡配置文件中会有eth0和eth1两块网卡，这里我们删除eth0，保留eth1，并将eth1的NAME="eth1"改为NAME="eth0"，完成后保存退出即可。

输入如下命令，修改IP地址文件，设置静态IP。

$ vi /etc/sysconfig/network-scripts/ifcfg-eth0

这里将“BOOTPROTO”后的参数改为static，“HWADDR”后的参数要符合本机的MAC地址，修改完成后在文件最末行添加如下所示（根据个人配置修改）。

IPADDR=该虚拟机的IP地址
NETMASK=255.255.255.0
GATEWAY=虚拟机的网关IP
DNS1=域名解析器对应PC端电脑的DNS地址

配置完成后，即可进行效果验证，即输入命令ifconfig查看IP配置是否生效，接下来可使用ping命令，查看是否可以链接外部网站。

测试

注意

上述的操作，在所有的虚拟机下都要进行配置，否则在后续的配置过程中，会出现错误，导致hadoop集群无法正常使用。

第六步 SSH服务配置

首先，输入如下命令查看当前虚拟机是否安装了ssh服务。

$ rpm -qa | grep ssh

同时使用ps -e | grep sshd命令查看ssh服务是否启动，通常为启动状态。如果未安装SSH服务，可执行yum install openssh-server命令进行安装。

其次使用终端仿真程序（SecureCRT/Xshell），连接虚拟机，这里本人采用的是SecureCRT，输入需要连接的IP地址和用户名、密码后，等待连接成功。

连接成功后，输入如下命令开始配置ssh免密登录。

$ ssh-keygen -t rsa

连续按四次回车键即可，之后我们需要将hadoop01主机的公钥复制到需要关联的服务器上（包括主机），执行ssh-copy-id hadoop02即可将公钥复制到hadoop02的主机上，其他主机只需要改主机名即可。配置完成后，输入ssh hadoop02验证是否可以远程连接。

ssh登录测试

第七步 JDK安装

由于hadoop是由java语言开发的，所以hadoop集群的使用要依赖java环境，因此我们还需对虚拟机的JDK进行安装。我们在安装CentOS时，系统会给我们安装好JDK的1.7下的版本，我们这里不使用该版本的JDK，所以在进行安装之前还需要删除本机自带的JDK，并安装好lrzsz，该软件是上传文件的可视化界面，便于我们操作。

删除本机自带的JDK命令：yum remove java* -y

安装lrzsz：yum install lrzsz -y

将下载好的8u161版本的JDK安装包使用rz命令，上传至Linux系统。

使用如下命令解压缩安装包

$ tar -zxvf jdk-8u161-linux-x64.tar.gz -C /export/software

解压完成后使用vi /etc/profile指令配置JDK的环境变量，将下面的内容添加到文件底部。

export JAVA_HOME=/export/software/jdk
export PATH=$PATH:$JAVA_HOME/bin
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

完成后保存退出即可，之后执行source /etc/profile指令使配置文件生效。

注意：上面的“JAVA_HOME=”后跟jdk的安装路径，这里我将jdk的原有名称使用了mv命令重命名为jdk，可根据个人配置，填写配置文件。

上述配置完成后，输入java -version验证Java环境是否安装成功。

jdk测试

至此，我们的hadoop基础运行环境配置结束。

注意：这里的配置需要在每一台主机上进行配置。

网友评论

本文标题：Linux系统搭建hadoop高性能集群（一）

本文链接：https://www.haomeiwen.com/subject/icbnvktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Linux系统搭建hadoop高性能集群（一）

关于此篇（题外话）

Linux系统搭建hadoop高性能集群（一）

第一步虚拟机的安装

第二步创建一个虚拟机

第三步虚拟机启动初始化

第四步虚拟机克隆

第五步 Linux系统网络配置

IP地址配置

配置主机名和IP映射

网络参数配置

注意

第六步 SSH服务配置

第七步 JDK安装

相关资料

相关文章

Linux系统搭建hadoop高性能集群（一）

Linux系统搭建hadoop高性能集群（二）

阿里腾讯云 hadoop+spark集群搭建（2）

阿里腾讯云 hadoop+spark集群搭建（1）

大数据Hadoop集群搭建-04安装配置HDFS

ZooKeeper集群搭建

hadoop集群环境搭建之伪分布式集群环境搭建（一）

Hadoop | Hadoop 环境搭建过程总结

hadoop学习大纲

Hadoop课程大纲

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

程序员

计算机学习

Linux系统搭建hadoop高性能集群（一）

关于此篇（题外话）

Linux系统搭建hadoop高性能集群（一）

第一步 虚拟机的安装

第二步 创建一个虚拟机

第三步 虚拟机启动初始化

第四步 虚拟机克隆

第五步 Linux系统网络配置

IP地址配置

配置主机名和IP映射

网络参数配置

注意

第六步 SSH服务配置

第七步 JDK安装

相关资料

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

第一步虚拟机的安装

第二步创建一个虚拟机

第三步虚拟机启动初始化

第四步虚拟机克隆