Overview
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
主要解决,海量数据的存储和海量数据的分析计算问题。
广义上来看,Hadoop通常指的是Hadoop生态圈。
Hadoop版本
1.Apache版本
最原始(最基础)的版本,对于入门学习最好。
官网地址:http://hadoop.apache.org/releases.html
下载地址:https://archive.apache.org/dist/hadoop/common/
2.Cloudera
在大型互联网企业中用的较多。
官网地址:https://www.cloudera.com/downloads/cdh/5-10-0.html
下载地址:http://archive-primary.cloudera.com/cdh5/cdh/5/
3.Hortonworks Hadoop
Hortonworks文档较好。
官网地址:https://hortonworks.com/products/data-center/hdp/
下载地址:https://hortonworks.com/downloads/#data-platform
Hadoop的优势
高可靠性
Hadoop底层维护多个数据副本,即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失。
高扩展性
集群间分配任务数据,可方便地扩展数以千计的节点。
高效性
在MapReduce的思想下,Hadoop是并行工作的。
高容错性
能够自动将失败的人物重新分配。
Hadoop组成
Hadoop1.x和Hadoop2.x的区别
image.png
网友评论