生态圈
1. HBase的数据存储在HDFS里
2. MapReduce可以计算HBase里的数据,也可以计算HDFS里的数据
3. Hive是数据分析数据引擎,也是MapReduce模型,支持SQL
4. Pig也是一个数据分析引擎,不支持SQL,有自己的Pig Latin数据
5. Sqoop是数据采集工具,针对关系数据库
6. Flume是针对文件等数据的采集
7. Hadoop的HA通过Zookeeper来实现
8. HUE是个插件,可以对Hadoop的生态进行图形化管理。
Hadoop的生态
网友评论