- Hadoop添加环境变量


- 初始化文件系统
类似于第一次使用优盘的时候,需要格式化。
输入命令

出现如下即成功格式化

- 启动Hadoop

经过三四次输入yes,密码后。。。。
如果成功

ResourceManager:资源管理进程,是yarn的老大。
NodeManager:yarn里面的小组长
NameNode:HDFS的老大。伪分布式中就有一个。集群中肯定有多个,为了安全
DataNode:HDFS的小弟,负责存放数据的仓库
SecondaryNameNode:是NameNode的助理,主要用来同步元数据。但是并不是NameNode的热备。只有在hadoop1和hadoop2的伪分布式才有。
-
web查看相应状态
-
HDFS管理界面
- yarn管理界面
-

- 测试hdfs
-
上传文件到hdfs
-

- 下载数据

- wordcount例子
数据输入和输出都是在hdfs中的

网友评论