Hadoop由哪几部分组成?

作者: Alukar | 来源:发表于2018-05-18 14:25 被阅读35次

Hadoop是一个能够对大量数据进行分布式处理的软件框架,以一种可靠、高效、可伸缩的方式进行数据处理,其有许多元素构成,以下是其组成元素:

1.Hadoop Common:Hadoop体系最底层的一个模块,为Hadoop各子项目提供各种工具,如:配置文件和日志操作等。

2.HDFS:分布式文件系统,提供高吞吐量的应用程序数据访问,对外部客户机而言,HDFS 就像一个传统的分级文件系统。可以创建、删除、移动或重命名文件,等等。但是HDFS 的架构是基于一组特定的节点构建的(参见图 1),这是由它自身的特点决定的。这些节点包括 NameNode(仅一个),它在 HDFS 内部提供元数据服务;DataNode,它为 HDFS 提供存储块。由于仅存在一个 NameNode,因此这是 HDFS 的一个缺点(单点失败)。

存储在 HDFS 中的文件被分成块,然后将这些块复制到多个计算机中(DataNode)。这与传统的 RAID 架构大不相同。块的大小(通常为 64MB)和复制的块数量在创建文件时由客户机决定。NameNode 可以控制所有文件操作。HDFS 内部的所有通信都基于标准的 TCP/IP 协议。

3.MapReduce:一个分布式海量数据处理的软件框架集计算集群。

4.Avro :doug cutting主持的RPC项目,主要负责数据的序列化。有点类似Google的protobuf和Facebook的thrift。avro用来做以后hadoop的RPC,使hadoop的RPC模块通信速度更快、数据结构更紧凑。

5.Hive :类似CloudBase,也是基于hadoop分布式计算平台上的提供data warehouse的sql功能的一套软件。使得存储在hadoop里面的海量数据的汇总,即席查询简单化。hive提供了一套QL的查询语言,以sql为基础,使用起来很方便。

6.HBase :基于HadoopDistributed File System,是一个开源的,基于列存储模型的可扩展的分布式数据库,支持大型表的存储结构化数据。

7.Pig :是一个并行计算的高级的数据流语言和执行框架 ,SQL-like语言,是在MapReduce上构建的一种高级查询语言,把一些运算编译进MapReduce模型的Map和Reduce中,并且用户可以定义自己的功能。

8.ZooKeeper:Google的Chubby一个开源的实现。它是一个针对大型分布式系统的可靠协调系统,提供的功能包括:配置维护、名字服务、分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。

9.Chukwa :一个管理大型分布式系统的数据采集系统 由yahoo贡献。

10.Cassandra:无单点故障的可扩展的多主数据库

11.Mahout :一个可扩展的机器学习和数据挖掘库

                                                                        长按识别关注我们,每天都有技术和精彩内容分享哦!~

相关文章

  • Hadoop由哪几部分组成?

    Hadoop是一个能够对大量数据进行分布式处理的软件框架,以一种可靠、高效、可伸缩的方式进行数据处理,其有许多元素...

  • 笔记:WebView

    1.webview的组成由哪几部分组成 答:由四个部分组成1.WebSettings 负责webview的设置部分...

  • 电脑基本操作原理

    电脑基本操作原理 1.电脑由哪几部分组成? 从外观上看,...

  • Hadoop重要组成概述

    题记 本文资料来源于拉钩大数据开发高薪训练营。 Hadoop 由四部分组成 Hadoop HDFS:(hadoop...

  • JS姿势

    1.JS由哪几部分组成: ECMAScript Bom Dom2.如图定义变量xmlHttpReques...

  • 前端面试每日 3+1 —— 第239天

    今天的知识点 (2019.12.11) —— 第239天 (我也要出题) [html] table由哪几部分组成?...

  • hadoop中高可用HA的HDFS的架构分析

    一、Hadoop组成 在Hadoop 1.x版本中,Hadoop由HDFS和MapReduce组成,前者负责分布式...

  • 内容创业团队由哪几部分组成?

    作为一个渴望长久发展的内容创业团队,很多核心职能必须具备。总的来说,内容团队的架构取决于目标人群和内容使命,并没有...

  • js中DOM和BOM

    1. javascript是由哪几部分组成? ECMAScript:(ES5.0) 变量 数据类型 运算符 流程...

  • 运动系统

    运动系统由哪几部分组成?有哪些主要功能 由骨、关节和骨骼肌三部分组成。 人体的运动系统主要是由骨、关节和骨骼肌三部...

网友评论

    本文标题:Hadoop由哪几部分组成?

    本文链接:https://www.haomeiwen.com/subject/tvsgdftx.html