大数据学习笔记之Hadoop安装步骤详解

大数据学习笔记之Hadoop安装步骤详解

作者: yoku酱 | 来源:发表于2019-05-15 15:52 被阅读6次

大数据学习笔记之Hadoop安装步骤详解
Hadoop篇（三）——Hadoop Streaming完成的数
Hadoop入门—基本原理简介
mapreduce框架详解
扣丁学堂大数据培训之Hadoop基础教程及学习路线
hadoop学习笔记
大数据学习笔记Hadoop之HDFS
Mac OSX上安装Hadoop
Hadoop学习笔记(2) ——解读Hello World
hadoop安装文档

一般大数据集群都是由Hadoop组成的，本文的最终目标是安装和配置两台Ubuntu服务器，让他们组成Hadoop的集群。

首先要安装vmware workstation虚拟软件，这个安装方法和一般的软件一样，这里附一个安装版本，供大家下载。

链接:https://pan.baidu.com/s/1qY9LBGC 密码:21w9

1、用vmware workstation建立虚拟机，开始先不选择安装包

内存选择：如果本机是4G内存，则分配虚拟机1G内存

2、按默认要求来，完成虚拟机的初步配置

【大数据开发学习资料领取方式】：加入大数据技术学习交流群458345782，点击加入群聊，私信管理员即可免费领取

3、开始ubuntu的安装

选择镜像文件（我用的版本也在上面的网盘里下载），然后一步步的安装

4、选择电脑名称为hd1，密码为123456。注意Your name设置为ubuntu

5、打开Ubuntu虚拟机，打开终端编辑器

6、安装并进入VMware Tools。安装通过点击虚拟机->安装VMware Tools进行安装。

7、复制VMware Tools的压缩包到另一个文件目录下。这里放到了tmp目录下。

8、解压VMWare Tools

9、解压后进入vmware-tools-distrib

10、继续编写命令进行安装 sudo./vmware-install.pl

11、安装VMware Tools成功

12、利用 sudo aptinstall vim安装vim。安装完成后如下图。

13、输入reboot重启，同时重启后输入init 0关闭虚拟机

14、复制hd1文件夹，命名为hd2，放在存虚拟机的文件夹下

15、用记事本打开hd2文件夹下的hd1.vmx。修改其中的displayName为hd2.

再用VMware WorkStation打开hd1.vmx

16、分别启动两台虚拟机

17、根据电脑的ip配置/etc/hosts文件，给IP地址一个别名，方便后面操作。注意ip地址为你两台虚拟机的ip地址。用ifconfig命令可以查看本机IP。一般是191.168.开头的一串IP地址。我配置如下。

sudo vim /etc/hosts

192.168.241.132 hd1

192.168.241.130 hd2

18、安装openssh-server

19、启动ssh

20、保证每次开机时自动启动ssh

21、多机互信，两台虚拟机都要执行ssh-keygen-t rsa命令。

22、进行密钥的互信，两台虚拟机都要执行cat id_rsa.pub >> authorized_keys命令。

23、将hd1的文件拷到hd2上，同时把hd2的文件拷到hd1上

24、验证已经实现双机互信

25、在hd1上进行hadoop的安装

26、在hd1和hd2上进行java的安装。

两台主机都要执行sudo apt install default-jre命令。

27、在hd1和hd2上分别进行相关目录的创建

接下来需要配置hadoop集群文件

配置文件有7个：

/home/ubuntu/hadoop/hadoop/etc/hadoop/hadoop-env.sh

/home/ubuntu/hadoop/hadoop/etc/hadoop/yarn-env.sh

/home/ubuntu/hadoop/hadoop/etc/hadoop/slaves

/home/ubuntu/hadoop/hadoop/etc/hadoop/core-site.xml

/home/ubuntu/hadoop/hadoop/etc/hadoop/hdfs-site.xml

/home/ubuntu/hadoop/hadoop/etc/hadoop/mapred-site.xml

/home/ubuntu/hadoop/hadoop/etc/hadoop/yarn-site.xml

28、配置env文件。28-34步只在hd1上完成

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-amd64/

export HADOOP_HOME=/home/hadoop/hadoop

29、配置yarn-env文件

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-amd64/

30、配置slave文件

hd1

hd2

31、配置core-site文件

<property>

<name>fs.defaultFS</name>

<value>hdfs://hd1:9000</value>

</property>

<property>

<name>io.file.buffer.size</name>

<value>131072</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>file:/home/ubuntu/hadoop/tmp</value>

</property>

<property>

<name>hadoop.proxyuser.hduser.hosts</name>

<value>*</value>

</property>

<property>

<name>hadoop.proxyuser.hduser.groups</name>

<value>*</value>

</property>

32、配置hdfs-site文件

<configuration>

<property>

<name>dfs.namenode.http-address</name>

<value>hd1:50070</value>

</property>

<property>

<name>dfs.namenode.secondary.http-address</name>

<value>hd1:9001</value>

</property>

<property>

<name>dfs.namenode.name.dir</name>

<value>file:/home/ubuntu/hadoop/namenode</value>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>file:/home/ubuntu/hadoop/hdfs</value>

</property>

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

<property>

<name>dfs.webhdfs.enabled</name>

<value>true</value>

</property>

<property>

<name>dfs.support.append</name>

<value>true</value>

</property>

<property>

<name>dfs.support.broken.append</name>

<value>true</value>

</property>

<property>

<name>dfs.permissions.enabled</name>

<value>false</value>

</property>

</configuration>

33、配置mapred-site文件

注意先将mapred-site.xml.template文件拷出，然后再使用vim命令

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

<property>

<name>mapreduce.jobhistory.address</name>

<value>hd1:10020</value>

</property>

<property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>hd1:19888</value>

</property>

【大数据开发学习资料领取方式】：加入大数据技术学习交流群458345782，点击加入群聊，私信管理员即可免费领取

34、配置yarn-site文件

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<property>

<name>yarn.resourcemanager.address</name>

<value>hd1:8032</value>

</property>

<property>

<name>yarn.resourcemanager.scheduler.address</name>

<value>hd1:8030</value>

</property>

<property>

<name>yarn.resourcemanager.resource-tracker.address</name>

<value>hd1:8031</value>

</property>

<property>

<name>yarn.resourcemanager.admin.address</name>

<value>hd1:8033</value>

</property>

<property>

<name>yarn.resourcemanager.webapp.address</name>

<value>hd1:8088</value>

</property>

35、在hd1和hd2上配置路径文件。执行下面两条命令

sudo vim /etc/profile

export PATH=$PATH:/home/ubuntu/hadoop/hadoop/bin:/home/ubuntu/hadoop/hadoop/sbin

36、在hd1上加入hadoop路径到path路径下

37、在hd1上格式化namenode，执行hadoop namenode -format命令

38、在hd1上进行文件的分发，注意命令行当前所在的位置。

39、验证是否安装成功

在hd1上建一个a.txt文件

拷到hdfs文件里面去

打印显示

自此安装成功

【大数据开发学习资料领取方式】：加入大数据技术学习交流群458345782，点击加入群聊，私信管理员即可免费领取

推荐阅读文章

大数据工程师在阿里面试流程是什么？

学习大数据需要具备怎么样基础？

年薪30K的大数据开发工程师的工作经验总结？

相关文章

大数据学习笔记之Hadoop安装步骤详解
一般大数据集群都是由Hadoop组成的，本文的最终目标是安装和配置两台Ubuntu服务器，让他们组成Hadoop的...
Hadoop篇（三）——Hadoop Streaming完成的数
1Hadoop Streaming完成的数据处理详解 1.1 Hadoop Streaming完成大数据处理详解 ...
Hadoop入门—基本原理简介
现在打算学习一些关于分布式，大数据，和hadoop的知识，创建一个笔记本，作为入门的笔记。 1. 安装hadoop...
mapreduce框架详解
参考：hadoop 学习笔记：mapreduce框架详解 [toc] 总结 Mapreduce是一个计算框架，既然...
扣丁学堂大数据培训之Hadoop基础教程及学习路线
扣丁学堂大数据培训之Hadoop基础教程详解，首先相信大多数人了解过大数据课程，对于大数据Hadoop技术是我们学...
hadoop学习笔记
这篇为学习hadoop的笔记，书籍来自《Hadoop构建数据仓库实战》 hadoop简介 hadoop是一个由...
大数据学习笔记Hadoop之HDFS
科多大数据老师根据同学们最近的问题总结了Hadoop之HDFS的学习笔记，现在分享给大家，希望这个学习笔记可以帮助...
Mac OSX上安装Hadoop
安装Hadoop 只是安装来学习Hadoop，所以，在自己笔记本上安装的。正式的线上环境会用多台机器搭建集群或者...
Hadoop学习笔记(2) ——解读Hello World
Hadoop学习笔记(2) ——解读Hello World 上一章中，我们把hadoop下载、安装、运行起来，最后...
hadoop安装文档
hadoop安装文档 a、安装前准备步骤操作系统：CentOS 7.0 版本：hadoop-2.7.3 hado...

网友评论

本文标题：大数据学习笔记之Hadoop安装步骤详解

本文链接：https://www.haomeiwen.com/subject/mmnpaqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

大数据开发

大数据爬虫Python AI Sql

玩转大数据

互联网科技

热点阅读

大数据开发

大数据爬虫Python AI Sql

程序员

玩转大数据

大数据

互联网科技

程序园

关于我们|服务条款|联系我们|大数据学习笔记之Hadoop安装步骤详解|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！