macOS安装hadoop 3.0.0伪分布式教程

作者: 棉花糖do | 来源:发表于2018-05-06 00:15 被阅读419次

macOS安装hadoop 3.0.0伪分布式教程
Hadoop安装攻略
win10编译hadoop3.0.0-beta1源码，获取win
Hadoop2.6.0的安装部署(伪分布式)
hadoop成长笔记
Hadoop分布式集群搭建
hadoop+hbase 伪分布式安装
Hadoop安装指南
Hadoop相关文章索引（3）
hadoop一小时搞定单机搭建

简介:Hadoop是一个由Apache基金会所开发的分布式系统基础架构。Hadoop的框架最核心的设计就是：HDFS和MapReduce。HDFS为海量的数据提供了存储，则MapReduce为海量的数据提供了计算.本教程将指导如何用苹果macOS系统安装Hadoop。

1：安装Homebrew

类似使用ubuntu系统apt-get的软件安装方式。macOS上也有类似这样的包管理器，利用Homebrew即可。 Homebrew的官方网站

安装Homebrew的方法：

/usr/bin/ruby -e "$(curl -fsSLhttps://raw.githubusercontent.com/Homebrew/install/master/install)"

ps:homebrew常用shell命

# 查看brew的帮助 brew -help

# 安装软件 brew install hadoop

# 卸载软件 brew uninstall hadoop

# 搜索软件 brew search hadoop

# 查看已经安装的软件 brew list

# 更新软件 brew update

# 更新某具体软件 brew upgrade hadoop

ps:环境变量配置

修改profile文件

nano ~/.bash_profile

添加如下内容:

export HADOOP_HOME=/usr/local/Cellar/hadoop/3.0.0/libexecexport PATH=$PATH:$HADOOP_HOME/bin/export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_121.jdk/Contents/Ho$export ANDROID_HOME=${HOME}/Library/Android/sdkexport PATH=${PATH}:${ANDROID_HOME}/toolsexport PATH=${PATH}:${ANDROID_HOME}/platform-toolsexport JAVA_OPTS="-Djava.library.path=$HADOOP_HOME/lib/native"

#这行需要注意，在笔者最开始这样配置的时候报过错，最后部分需要改为$HADOOP_INSTALL/lib/native，但后来测试的时候又不需要了。所以如果读者本遇到类似缺库的问题，可以尝试修改这个地方。

export HADOOP_OPTS="-Djava.library.path=HADOOP_INSTALL/lib/native #HADOOP VARIABLES END

顺便在这里配置java路径：

首先输入代码看看你把 Java 装到哪里了：

/usr/libexec/java_home

输入代码： java -version

如果已经装了Java，你会看到类似酱紫结果：

java version "1.8.0_121"Java(TM) SE Runtime Environment (build 1.8.0_121-b13)Java HotSpot(TM) 64-Bit Server VM (build 25.121-b13, mixed mode)

如果没有，用 Homebrew 安装了最新版本 Java：brew install java

2:ssh登录本地

首先在系统里打开远程登录，位置在 System Preference -> Sharing 中，左边勾选 Remote Login，右边选择 All Users。

系统偏好可用快捷键 command+space 中搜索 "System Preference" 打开。

1:首先生成ssh公钥，终端命令代码如下

ssh-keygen -t rsa -P ""

cat HOME/.ssh/authorized_keys

2:接下来进行测试登录本地是否成功，在 Terminal 里输入以下代码查看能不能免密 ssh 到 localhost：

ssh localhost

3:登录成功显示结果如下：

3:安装Hadoop

3.1 : 输入以下代码，自动安装hadoop:

brew install hadoop

安装过程会提示重要的信息，如下：

$JAVA_HOME has been set to be the output of: /usr/libexec/java_home

在macOS中，我们可以终端输入：/usr/libexec/java_home来获取JAVA_HOME的路径 Hadoop的安装需要配置JAVA_HOME，用 brew安装，就已经帮我们配置好了。

ps：通过Homebrew安装软件后，软件目录一般位于/usr/local/Cellar,并软件目录里面带有版本号. 如图我的hadoop安装目录如下：

4:测试Hadoop是否安装成功

Hadoop有三种安装模式：单机模式，伪分布式模式，分布式模式分布式模式需要在多台电脑上面测试，这里只测试 伪分布式模式

4.1:测试伪分布式模式

测试为分布模式前，需要修改相关的5个配置文件，把homebrew默认的单机模式修改成伪分布式模式

可以使用nano或者vim进行配置文件的修改，我这里使用sublime文本编辑器修改，方便省事儿。修改路径如图所示：

修改Core-site.xml（位置 etc/hadoop/），改参数如下：

.修改mapred-site.xml （位置 etc/hadoop/），改参数如下：

如果文件后缀是 .xml.example，改为 .xml。

变量mapred.job.tracker 保存了JobTracker的位置，因为只有MapReduce组件需要知道这个位置，所以它出现在mapred-site.xml文件中。

修改hdfs-site.xml（位置 etc/hadoop/），改参数如下：

变量dfs.replication指定了每个HDFS数据库的复制次数。通常为3, 由于我们只有一台主机和一个伪分布式模式的DataNode，将此值修改为1。

修改yarn-site.xml（位置 etc/hadoop/），改参数如下：

修改hadoop-env.sh（位置 etc/hadoop/），改参数如下：然后开启hadoop-env.sh里的注释

4.2：运行hadoop以及查看远端

进入文件夹（重要重要重要：后续所有操作一定要先进入当前hadoop文件夹）

cd /usr/local/Cellar/hadoop/3.0.0

格式化文件系统（是对namenode进行初始化）：

./bin/hdfs namenode -format

启动 NameNode 和 DataNode：

$ ./sbin/start-dfs.sh

如果遇到DataNode启动失败，尝试删除tmp文件夹。

关闭伪分布式

./sbin/stop-all.sh

ps：hadoop3.x版本的端口号改变如图：

现在你应该可以在浏览器中打开下面的链接看到亲切的 Overview 界面了：

NameNode - http://localhost:9870

让 HDFS 可以被用来执行 MapReduce jobs：

$ ./bin/hdfs dfs -mkdir /user

$ ./bin/hdfs dfs -mkdir /user/input

把改成你想要命名的任意子文件夹名字即可，这里我选择命名input.

启动 ResourceManager 和 NodeManager：

$ ./sbin/start-yarn.sh

现在你应该可以在浏览器中打开下面的链接看到亲切的 All Applications 界面了：

ResourceManager - http://localhost:8088

网友评论

X星人的女王大人:博主你好，我在start-dfs之后会出现这样的问题：
Starting secondary namenodes [LYsMacPro]
LYsMacPro: ssh: Could not resolve hostname lysmacpro: nodename nor servname provided, or not known

LYsMacPro是我的主机名，安了3遍了。。。每次都有不一样的错误，但是这里是一样的TAT
张照博:ResourceManager - http://localhost:8088

这儿没法进去。博主遇到过吗？
张照博:搞定。。Java9果然是个野种。。换到Java1.8 整个系统乖的不行
fa6a15d262a9:我在配置的时候发现一个坑。就是不要用jdk8以上版本的java来配置环境。jdk9默认禁止访问许多javax的API导致hadoop3启动失败
张照博:。。Failed to retrieve data from /webhdfs/v1/?op=LISTSTATUS: Server Error

心痛
棉花糖do:@kQYsnJc 毕竟hadoop3.x版本也是比较新的，坑比较多吧
fa6a15d262a9:博主我按照你的操作来弄了。
在输入$ ./sbin/start-dfs.sh时候，提示2018-05-10 17:27:04,009 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable.
棉花糖do:我也是报这个警告的，是因为通过homebrew安装的hadoop根目录下没有lib/native这个文件夹的，具体的我没研究。网上百度了下提示这条警告提示是关于 Hadoop 本地库的，一般情况下不影响hadoop正常的操作的， Hadoop本地库是为了提高效率或者某些不能用Java实现的功能组件库。可以参考传送门： http://rockyfeng.me/hadoop_native_library_mac.html Mac OSX 下 Hadoop 使用本地库提高效率来做处理。

本文标题：macOS安装hadoop 3.0.0伪分布式教程

本文链接：https://www.haomeiwen.com/subject/sawgkftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！