什么是hadoop
hadoop是apache下的一款开源分布式大数据处理框架,通过多台廉价机器搭建集群的方式 ,提供分布式大数据处理,节点监控容错和恢复功能。hadoop具有可扩展型、可靠性。
Hadood相关模块
- Hadoop Common 提供支撑其他hadoop模块的基本功能
- Hadoop Distributed File System(HDFS)高吞吐量的分布式文件系统
- Hadoop Yarn 任务调度和集群资源管理框架
- Hadoop MapReduce 并行处理大数据集的计算框架
网友评论