1. 分布式解决方案
-
分布式存储
image.png -
分布式计算
image.png
image.png
image.png -
有向无环图
image.png
image.png
image.png -
冗余存储与冗余计算
image.png
现实中 Hadoop 的实现机制 则更加 复杂 ,但其 架构的基本思路 和本节很 类似 。
分布式存储 和分布式计算 这两者间并没有关系,它们各自都可以独立存在。
当MapReduce 运行于 HDFS 上时, 性能较好
2. Hadoop 简述
-
Hadoop 由来
image.png
image.png
image.png -
Hadoop 相关项目
image.png
image.png -
Hadoop 应用
image.png
3. Hadoop 部署
-
部署综述
image.png - 部署步骤
image.png
硬件环境
由于分布式计算需要用到很多机器,部署时户须提供台至几根据“部署规划 ”确定。
实际上,完全模式部署 Hadoop 时, 最低需要两台机器(一个主节点,一个从节点), 此 外, 硬件方面每台机器最低要求有 1GB 内存, 20GB 硬盘空间 。
软件环境
-
Hadoop 依赖软件
image.png -
Hadoop 部署实例
image.png
image.png
image.png
image.png
网友评论