大数据｜Hadoop部署安装和启动以及目录结构介绍（三）

大数据｜Hadoop部署安装和启动以及目录结构介绍（三）

作者: 小怪聊职场 | 来源:发表于2017-10-18 13:06 被阅读0次

大数据｜Hadoop部署安装和启动以及目录结构介绍（三）
Hadoop 总结三 hadoop目录结构以及运行模式
大数据分析利器之Hive01
Hadoop安装配置之本地模式安装
Hadoop 入门(一)
hadoop实验
Hadoop 集群搭建
Hadoop的目录结构有哪些
Hadoop 在 CentOS 7.x 操作系统中的安装、配置及
【Hadoop】Hadoop 集群安装

一、hadoop的部署安装

1、安装JDK：下载jdk，解压，配置环境变量

2、安装hadoop：下载安装包，解压

利用tar -zxvf把hadoop的jar包放到指定的目录下。

tar -zxvf /home/software/hadoop-2.4.1.tar.gz

-z：以gz结尾的文件就是用gzip压缩的结果。与gzip相对的就是gunzip，这个参数的作用就是用来调用gzip。

-x：--extract，--get解压文件

-v：显示操作过程，这个参数很常用

-f：使用文档名，注意，在f之后要立即接文档名，不要再加其他参数

二、修改hadoop配置文件，为启动hadoop做准备

1、先熟悉下hadoop整个的目录结构

1）bin：Hadoop最基本的管理脚本和使用脚本的目录，这些脚本是sbin目录下管理脚本的基础实现，用户可以直接使用这些脚本管理和使用Hadoop。

2）sbin：Hadoop管理脚本所在的目录，主要包含HDFS和YARN中各类服务的启动/关闭脚本。

3）etc：Hadoop配置文件所在的目录，包括core-site.xml、hdfs-site.xml、mapred-site.xml等从Hadoop1.0继承而来的配置文件和yarn-site.xml等Hadoop2.0新增的配置文件。

4）本地平台相关库（include、lib、libexec），include：对外提供的编程库头文件（具体动态库和静态库在lib目录中），这些头文件均是用C++定义的，通常用于C++程序访问HDFS或者编写MapReduce程序。lib：该目录包含了Hadoop对外提供的编程动态库和静态库，与include目录中的头文件结合使用。libexec：各个服务对用的shell配置文件所在的目录，可用于配置日志输出、启动参数（比如JVM参数）等基本信息。

5）share：Hadoop各个模块编译后的jar包所在的目录。

hadoop的目录结构

2、hadoop重点目录介绍及修改

1）etc/hadoop/hadoop-env.sh

配置etc/hadoop/hadoop-env.sh文件，修改为你的jdk的安装位置。

hadoop-env.sh

2）etc/hadoop/core-site.xml

编辑文件etc/hadoop/core-site.xml文件，指定默认文件系统和工作空间（现在该路径下还没有tmp文件夹，执行完hdfs格式化后便可看到相关文件）。

core-site.xml

3）etc/hadoop/hdfs-site.xml

编辑文件etc/hadoop/hdfs-site.xml文件，设置文件副本数，也就是文件分割成块后，要复制块个数（由于此处就本机一个节点，伪分布式，所以就配置为1，文件本身，不需要副本）。

hdfs-site.xml

4）etc/hadoop/mapred-site.xml

编辑文件etc/hadoop/mapred-site.xml文件，此文件其实不存在，是把存在的mapred-site.xml.template修改为mapred-site.xml（mv mapred-site.xml.template mapred-site.xml），用于指定资源调度框架。

mapred-site.xml

5）etc/hadoop/yarn-site.xml

编辑文件etc/hadoop/yarn-site.xml文件，yarn也是分布式管理的，所以配置一个主服务器，然后还要配置中间数据调度的机制。

yarn-site.xml

6）配置masters和slaves主从结点

配置/masters和/slaves来设置主从结点，注意最好使用主机名，并且保证机器之间通过主机名可以互相访问，每个主机名一行。

masters和slaves

总结：配置结束，把配置好的hadoop文件夹拷贝到其他集群的机器中，并且保证上面的配置对于其他机器而言正确，例如：如果其他机器的Java安装路径不一样，要修改etc/hadoop/hadoop-env.sh。

三、启动hadoop

1）格式化hdfs

在bin/hadoop中执行 ./hadoop namenode -format，或如下图直接执行。

格式化hdfs

2）启动hdfs

mapreduce不是服务，只是一个库，所以不需要启动。hdfs和yarn是相互独立的服务，可以单独启动，也可以使用hadoop的脚本自动化启动。

（1）方法一：分别启动

启动hdfs的脚本在sbin/hadoop-daemon.sh中，手动启动方式如下：

手动启动hdfs

启动yarn的脚本在sbin/yarn-daemon.sh中，手动启动方式如下：

手动启动yarn

（2）方法二：自动化启动

启动hdfs，sbin/start-dfs.sh

启动yarn，sbin/start-yarn.sh

（3）方法三：

同时启动hdfs和yarn，sbin/start-all.sh

相关文章

大数据｜Hadoop部署安装和启动以及目录结构介绍（三）
一、hadoop的部署安装 1、安装JDK：下载jdk，解压，配置环境变量 2、安装hadoop：下载安装包，解压...
Hadoop 总结三 hadoop目录结构以及运行模式
Hadoop 总结三 hadoop目录结构以及运行模式 3.1 hadoop目录结构 3.2 重要目录 bin...
大数据分析利器之Hive01
一、课前准备安装好对应版本的hadoop集群，并启动hadoop的HDFS以及YARN服务 MySQL安装部署及...
Hadoop安装配置之本地模式安装
Hadoop安装部署方式有三种，在这里介绍其中一种安装部署方式——本地模式。Hadoop本地模式中没有HDFS，只...
Hadoop 入门(一)
目录 Hadoop 安装单点启动&集群启动访问 HDFS 常用配置常用命令 Hadoop 安装软件准备运...
hadoop实验
1 wordcount 启动hadoop 进入hadoop安装目录 cd /usr/local/hadoop输入命...
Hadoop 集群搭建
目录集群简介服务器准备环境和服务器设置 JDK环境安装 Hadoop安装部署启动集群测试集群简介在进...
Hadoop的目录结构有哪些
接下来介绍有关Hadoop的源码目录结构、各文件夹的职责以及源码中的包结构以及核心包对应的功能。 1、bin目录 ...
Hadoop 在 CentOS 7.x 操作系统中的安装、配置及
本文介绍在 CentOS 7.x 操作系统上安装 Hadoop 的方法与过程。目录版本说明安装配置启动运...
【Hadoop】Hadoop 集群安装
本篇结构：前言准备条件安装 Hadoop 集群启动 Hadoop 集群一、前言开始使用 Hadoop，...

网友评论

本文标题：大数据｜Hadoop部署安装和启动以及目录结构介绍（三）

本文链接：https://www.haomeiwen.com/subject/tamjuxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

我爱编程

程序员

关于我们|服务条款|联系我们|大数据｜Hadoop部署安装和启动以及目录结构介绍（三）|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！