美文网首页
Hadoop介绍

Hadoop介绍

作者: 乙腾 | 来源:发表于2020-10-21 08:06 被阅读0次

    Overview

    Hadoop是一个由Apache基金会所开发的分布式系统基础架构。

    主要解决,海量数据的存储和海量数据的分析计算问题。

    广义上来看,Hadoop通常指的是Hadoop生态圈。

    Hadoop版本

    1.Apache版本

    最原始(最基础)的版本,对于入门学习最好。

    官网地址:http://hadoop.apache.org/releases.html

    下载地址:https://archive.apache.org/dist/hadoop/common/

    2.Cloudera

    在大型互联网企业中用的较多。

    官网地址:https://www.cloudera.com/downloads/cdh/5-10-0.html

    下载地址:http://archive-primary.cloudera.com/cdh5/cdh/5/

    3.Hortonworks Hadoop

    Hortonworks文档较好。

    官网地址:https://hortonworks.com/products/data-center/hdp/

    下载地址:https://hortonworks.com/downloads/#data-platform

    Hadoop的优势

    高可靠性

    Hadoop底层维护多个数据副本,即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失。

    高扩展性

    集群间分配任务数据,可方便地扩展数以千计的节点。

    高效性

    在MapReduce的思想下,Hadoop是并行工作的。

    高容错性

    能够自动将失败的人物重新分配。

    Hadoop组成

    Hadoop1.x和Hadoop2.x的区别

    image.png

    相关文章

      网友评论

          本文标题:Hadoop介绍

          本文链接:https://www.haomeiwen.com/subject/dshsmktx.html