Hadoop2.8.5伪分布运行wordcount

作者: 菠菜本菠 | 来源:发表于2018-12-13 23:39 被阅读0次

Hadoop2.8.5伪分布运行wordcount
ubuntu18.04（后面换了16.04）配置hadoop2.
Hadoop2.8.5伪分布安装步骤
hadoop成长笔记
Spark启动命令
Hadoop系列－Hadoop 运行模式
Spark wordcount开发并提交到单机(伪分布式)运行
Hadoop学习2
我的Hadoop笔记——第二讲
Hadoop的安装使用简介

首先要运行hadoop

注意：我的Hadoop目录为 /usr/hadoop

cd /usr/hadoop/sbin
./start-all.sh
jps

查看 Java 进程如下

Jps进程查看

注意，确实某个Java进程很可能运行失败，查一下自己Hadoop配的是否正确
可以参照我的Hadoop2.8.5伪分布安装步骤

创建file文件夹

创建名称为file的文件夹并向里面写点东西，我这里创建的路径为/usr/hadoop/file

cd /usr/hadoop
mkdir file
cd file
echo "hello world, hadoop java" >> file1.txt 
echo "hello world, hadoop python" >> file2.txt

创建文件

在HDFS上创建文件夹目录/input

创建完后把本地硬盘上创建的文件传进input里面：

hadoop fs -mkdir /input
hadoop fs -put /usr/hadoop/file/file*.txt /input

可以用hadoop fs -ls查看结果

HDFS上的文件

找到Hadoop自带运行的wordcount java包

一般在Hadoop相对路径的 ./hadoop/share/hadoop/mapreduce 中

Hadoop自带例子程序
例子jar包就是这个hadoop-mapreduce-examples-2.8.5.jar

运行命令如下：（写到/output/wordcount1中)

hadoop jar hadoop-mapreduce-examples-2.8.5.jar wordcount /input/ /output/wordcount1

看一下/output/wordcount1中有什么

hadoop fs -ls /output/wordcount1

MR后的内容
发现新建了一个_SUCCESS文件和一个part-r-00000文件

内容存储在part-r-00000文件中，查看结果命令如下：

hadoop fs -cat /output/wordcount1/part-r-00000

运行结果

网友评论

本文标题：Hadoop2.8.5伪分布运行wordcount

本文链接：https://www.haomeiwen.com/subject/obiihqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！