大数据技术之Hadoop（二）

作者: pauls | 来源:发表于2021-04-17 08:00 被阅读0次

大数据技术之Hadoop（二）
大数据入门学习之Hadoop技术优缺点
我的读书列表
扣丁学堂大数据培训之Hadoop基础教程及学习路线
好程序员大数据培训学习之Hadoop技术优缺点
Hadoop集群环境搭建
Hadoop安装
Hadoop集群环境搭建
Hadoop集群搭建
大数据 | 史上最详细的Hadoop环境搭建

Hadoop 运行环境搭建

2.1 模板虚拟机环境准备

0 ）安装模板虚拟机，IP 地址 192.168.10.100 、主机名称 hadoop100 、内存 4G 、硬盘 50G

1 ）hadoop100 虚拟机配置要求如下（本文 Linux 系统全部以 CentOS-7.5-x86-1804 为例）
（1）使用 yum 安装需要虚拟机可以正常上网，yum 安装前可以先测试下虚拟机联网情况

[root@hadoop100 ~]# ping www.baidu.com
PING www.baidu.com (14.215.177.39) 56(84) bytes of data.
64 bytes from 14.215.177.39 (14.215.177.39): icmp_seq=1
ttl=128 time=8.60 ms
64 bytes from 14.215.177.39 (14.215.177.39): icmp_seq=2
ttl=128 time=7.72 ms

（2）安装 epel-release
注：Extra Packages for Enterprise Linux 是为“红帽系”的操作系统提供额外的软件包，适用于 RHEL、CentOS 和 Scientific Linux。相当于是一个软件仓库，大多数 rpm 包在官方repository 中是找不到的）

[root@hadoop100 ~]# yum install -y epel-release

（3）注意：如果 Linux 安装的是最小系统版，还需要安装如下工具；如果安装的是 Linux桌面标准版，不需要执行如下操作
➢ net-tool：工具包集合，包含 ifconfig 等命令

[root@hadoop100 ~]# yum install -y net-tools

➢ vim：编辑器

[root@hadoop100 ~]# yum install -y vim

2 ）关闭防火墙，关闭防火墙开机自启

[root@hadoop100 ~]# systemctl stop firewalld
[root@hadoop100 ~]# systemctl disable firewalld.service

注意：在企业开发时，通常单个服务器的防火墙时关闭的。公司整体对外会设置非常安全的防火墙
3 ）创建 atguigu 用户，并修改 atguigu 用户的密码

[root@hadoop100 ~]# useradd atguigu
[root@hadoop100 ~]# passwd atguigu

4 ）配置 atguigu 用户具有 root 权限，方便后期加加 sudo 执行 root 权限的命令

[root@hadoop100 ~]# vim /etc/sudoers

修改/etc/sudoers 文件，在%wheel 这行下面添加一行，如下所示：

## Allow root to run any commands anywhere
root ALL=(ALL) ALL
## Allows people in group wheel to run all commands
%wheel ALL=(ALL) ALL
atguigu ALL=(ALL) NOPASSWD:ALL

注意：atguigu 这一行不要直接放到 root 行下面，因为所有用户都属于 wheel 组，你先配置了 atguigu 具有免密功能，但是程序执行到%wheel 行时，该功能又被覆盖回需要密码。所以 atguigu 要放到%wheel 这行下面。
5 ）在/opt 目录下创建文件夹，并修改所属主和所属组
（1）在/opt 目录下创建 module、software 文件夹

[root@hadoop100 ~]# mkdir /opt/module
[root@hadoop100 ~]# mkdir /opt/software

（2）修改 module、software 文件夹的所有者和所属组均为 atguigu 用户

[root@hadoop100 ~]# chown atguigu:atguigu /opt/module
[root@hadoop100 ~]# chown atguigu:atguigu /opt/software

（3）查看 module、software 文件夹的所有者和所属组

[root@hadoop100 ~]# cd /opt/
[root@hadoop100 opt]# ll
总用量 12
drwxr-xr-x. 2 atguigu atguigu 4096 5 月 28 17:18 module
drwxr-xr-x. 2 root root 4096 9 月 7 2017 rh
drwxr-xr-x. 2 atguigu atguigu 4096 5 月 28 17:18 software

6 ）卸载虚拟机自带的 JDK
注意：如果你的虚拟机是最小化安装不需要执行这一步。

[root@hadoop100 ~]# rpm -qa | grep -i java | xargs -n1 rpm -e
--nodeps

➢ rpm -qa：查询所安装的所有 rpm 软件包
➢ grep -i：忽略大小写
➢ xargs -n1：表示每次只传递一个参数
➢ rpm -e –nodeps：强制卸载软件
7 ）重启虚拟机

[root@hadoop100 ~]# reboot

2.2 克隆虚拟机

1 ）利用模板机 hadoop100 ，克隆三台虚拟机：hadoop102 hadoop103 hadoop104
注意：克隆时，要先关闭 hadoop100
2 ）修改克隆机 IP ，以下以 hadoop102 举例说明
（1）修改克隆虚拟机的静态 IP

[root@hadoop100 ~]# vim /etc/sysconfig/network-scripts/ifcfg-
ens33

改成

DEVICE=ens33
TYPE=Ethernet
ONBOOT=yes
BOOTPROTO=static
NAME="ens33"
IPADDR=192.168.10.102
PREFIX=24
GATEWAY=192.168.10.2
DNS1=192.168.10.2

（2）查看 Linux 虚拟机的虚拟网络编辑器，编辑->虚拟网络编辑器->VMnet8

image.png

（3）查看 Windows 系统适配器 VMware Network Adapter VMnet8 的 IP 地址

image.png

（4）保证 Linux 系统 ifcfg-ens33 文件中 IP 地址、虚拟网络编辑器地址和 Windows 系
统 VM8 网络 IP 地址相同。
3 ）修改克隆机主机名，以下以 hadoop102 举例说明
（1）修改主机名称

[root@hadoop100 ~]# vim /etc/hostname
hadoop102

（2）配置 Linux 克隆机主机名称映射 hosts 文件，打开/etc/hosts

[root@hadoop100 ~]# vim /etc/hosts

添加如下内容

192.168.10.100 hadoop100
192.168.10.101 hadoop101
192.168.10.102 hadoop102
192.168.10.103 hadoop103
192.168.10.104 hadoop104
192.168.10.105 hadoop105
192.168.10.106 hadoop106
192.168.10.107 hadoop107
192.168.10.108 hadoop108

4 ）重启克隆机 hadoop102

[root@hadoop100 ~]# reboot

5 ）修改 windows 的主机映射文件（hosts 文件）
（1）如果操作系统是 window7，可以直接修改
（a）进入 C:\Windows\System32\drivers\etc 路径
（b）打开 hosts 文件并添加如下内容，然后保存

192.168.10.100 hadoop100
192.168.10.101 hadoop101
192.168.10.102 hadoop102
192.168.10.103 hadoop103
192.168.10.104 hadoop104
192.168.10.105 hadoop105
192.168.10.106 hadoop106
192.168.10.107 hadoop107
192.168.10.108 hadoop108

（2）如果操作系统是 window10，先拷贝出来，修改保存以后，再覆盖即可
（a）进入 C:\Windows\System32\drivers\etc 路径
（b）拷贝 hosts 文件到桌面
（c）打开桌面 hosts 文件并添加如下内容

192.168.10.100 hadoop100
192.168.10.101 hadoop101
192.168.10.102 hadoop102
192.168.10.103 hadoop103
192.168.10.104 hadoop104
192.168.10.105 hadoop105
192.168.10.106 hadoop106
192.168.10.107 hadoop107
192.168.10.108 hadoop108

（d）将桌面 hosts 文件覆盖 C:\Windows\System32\drivers\etc 路径 hosts 文件

2.3 在在 hadoop102 安装 JDK

1 ）卸载现有 JDK
注意：安装 JDK 前，一定确保提前删除了虚拟机自带的 JDK。详细步骤见问文档 3.1 节
中卸载 JDK 步骤。
2 ）用 XShell 传输工具将 JDK 导入到 opt 目录下面的 software 文件夹下面

image.png

3 ）在在 Linux 系统下的 opt 目录中查看软件包是否导入成功

[sl@hadoop102 ~]$ ls /opt/software/

看到如下结果：

jdk-8u212-linux-x64.tar.gz

4 ）解压 JDK 到/opt/module 目录下

[sl@hadoop102  software]$  tar  -zxvf  jdk-8u212-linux-
x64.tar.gz -C /opt/module/

5 ）配置 JDK 环境变量
（1）新建/etc/profile.d/my_env.sh 文件

[sl@hadoop102 ~]$ sudo vim /etc/profile.d/my_env.sh

添加如下内容

#JAVA_HOME
export JAVA_HOME=/opt/module/jdk1.8.0_212
export PATH=$PATH:$JAVA_HOME/bin

（2）保存后退出
:wq
（3）source 一下/etc/profile 文件，让新的环境变量 PATH 生效

[sl@hadoop102 ~]$ source /etc/profile

6 ）测试 JDK 是否安装成功

[sl@hadoop102 ~]$ java -version

如果能看到以下结果，则代表 Java 安装成功。

java version "1.8.0_212"

注意：重启（如果 java -version 可以用就不用重启）

[sl@hadoop102 ~]$ sudo reboot

2.4 在在 hadoop102 安装 Hadoop

Hadoop 下载地址
1 ）用 XShell 文件传输工具将 hadoop-3.1.3.tar.gz 导入到 opt 目录下面的 software 文件夹下面

image.png

2 ）进入到 Hadoop 安装包路径下

[sl@hadoop102 ~]$ cd /opt/software/

3 ）解压安装文件到/opt/module 下面

[sl@hadoop102 software]$ tar -zxvf hadoop-3.1.3.tar.gz -C
/opt/module/

4 ）查看是否解压成功

[sl@hadoop102 software]$ ls /opt/module/
hadoop-3.1.3

5 ）将将 Hadoop 添加到环境变量
（1）获取 Hadoop 安装路径

[sl@hadoop102 hadoop-3.1.3]$ pwd
/opt/module/hadoop-3.1.3

（2）打开/etc/profile.d/my_env.sh 文件

[sl@hadoop102  hadoop-3.1.3]$  sudo  vim
/etc/profile.d/my_env.sh

➢ 在 my_env.sh 文件末尾添加如下内容：（shift+g）

#HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop-3.1.3
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

➢ 保存并退出： :wq
（3）让修改后的文件生效

[sl@hadoop102 hadoop-3.1.3]$ source /etc/profile

6 ）测试是否安装成功

[sl@hadoop102 hadoop-3.1.3]$ hadoop version
Hadoop 3.1.3

7 ）重启（如果 Hadoop 命令不能用再重启虚拟机）

[sl@hadoop102 hadoop-3.1.3]$ sudo reboot

2.5 Hadoop 目录结构

1 ）查看 Hadoop 目录结构

[sl@hadoop102 hadoop-3.1.3]$ ll
总用量 52
drwxr-xr-x. 2 sl sl 4096 5 月 22 2017 bin
drwxr-xr-x. 3 sl sl 4096 5 月 22 2017 etc
drwxr-xr-x. 2 sl sl 4096 5 月 22 2017 include
drwxr-xr-x. 3 sl sl 4096 5 月 22 2017 lib
drwxr-xr-x. 2 sl sl 4096 5 月 22 2017 libexec
-rw-r--r--. 1 sl sl 15429 5 月 22 2017 LICENSE.txt
-rw-r--r--. 1 sl sl 101 5 月 22 2017 NOTICE.txt
-rw-r--r--. 1 sl sl 1366 5 月 22 2017 README.txt
drwxr-xr-x. 2 sl sl 4096 5 月 22 2017 sbin
drwxr-xr-x. 4 sl sl 4096 5 月 22 2017 share

2 ）重要目录
（1）bin 目录：存放对 Hadoop 相关服务（hdfs，yarn，mapred）进行操作的脚本
（2）etc 目录：Hadoop 的配置文件目录，存放 Hadoop 的配置文件
（3）lib 目录：存放 Hadoop 的本地库（对数据进行压缩解压缩功能）
（4）sbin 目录：存放启动或停止 Hadoop 相关服务的脚本
（5）share 目录：存放 Hadoop 的依赖 jar 包、文档、和官方案例

网友评论

大数据技术

本文标题：大数据技术之Hadoop（二）

本文链接：https://www.haomeiwen.com/subject/lmpykltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

大数据技术之Hadoop（二）

Hadoop 运行环境搭建

2.1 模板虚拟机环境准备

2.2 克隆虚拟机

2.3 在在 hadoop102 安装 JDK

2.4 在在 hadoop102 安装 Hadoop

2.5 Hadoop 目录结构

相关文章

大数据技术之Hadoop（二）

大数据入门学习之Hadoop技术优缺点

我的读书列表

扣丁学堂大数据培训之Hadoop基础教程及学习路线

好程序员大数据培训学习之Hadoop技术优缺点

Hadoop集群环境搭建

Hadoop安装

Hadoop集群环境搭建

Hadoop集群搭建

大数据 | 史上最详细的Hadoop环境搭建

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

大数据技术

大数据技术之Hadoop（二）

Hadoop 运行环境搭建

2.1 模板 虚拟机 环境准备

2.2 克隆 虚拟机

2.3 在 在 hadoop102 安装 JDK

2.4 在 在 hadoop102 安装 Hadoop

2.5 Hadoop 目录 结构

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

2.1 模板虚拟机环境准备

2.2 克隆虚拟机

2.3 在在 hadoop102 安装 JDK

2.4 在在 hadoop102 安装 Hadoop

2.5 Hadoop 目录结构