美文网首页
1)Hadoop基础组成框架

1)Hadoop基础组成框架

作者: bullion | 来源:发表于2018-10-19 14:11 被阅读0次

Hadoop介绍

1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构

2)主要解决海量数据的存储分析计算问题

Hadoop生态圈

Hadoop优势

1)高可靠性:Hdoop底层维护多个数据副本,即使存储出现故障也不会导致数据丢失

2)高扩展性:方便扩展节点

3)高效性:并行工作加快任务处理速度

4)高容错性:自动将失败的任务重新分配

Hadoop1和Hadoop2的区别

    在Hadoop1时代Hadoop中的MapReduce同时处理业务逻辑运算和资源的调度,耦合性较大,在Hadoop2时增加了Yarn,只负责资源的调度,MapReduce只负责运算。

Hadoop组成

MapReduce(计算)

Yarn(资源调度)

HDFS(数据存储)

Common(辅助工具)

HDFS架构

1)NameNode(nn):存储文件的元数据,如文件名,文件目录结构,文件属性(生成时间,副本数,文件权限),以及每个文件的块列表和块所在的DataNode等。

2)DataNode(dn):在本地文件系统存储文件块数据,以及块数据的校验

3)Secondary NameNode(2nn):用来监控HDFS状态的辅助后台程序,每隔一段时间获取HDFS元数据的快照

Yarn架构

1)ResourceManager(RM)

    处理客户端请求

    监控NodeManager

    启动或监控ApplicationMaster

    资源分配与调度

2)NodeManager(NM)

    管理单个节点上的资源

    处理来自ResourceManager的命令

    处理来自ApplicationMaster的命令

3)ApplicationMaster(AM)

    负责数据切分

    为应用程序申请资源并分配给内部任务

    任务的监控与容错

4)Container

    Yarn中的资源抽象,封装了某个节点上的多维度资源,如内存,CPU,磁盘,网络等

MapReduce架构

1)Map 阶段并行处理输入数据

2)Reduce 阶段对Map结果进行汇总

相关文章

  • 1)Hadoop基础组成框架

    Hadoop介绍 1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构 2)主要解决海量数据的存储...

  • 在阿里云ECS服务器上搭建Hadoop集群

    在阿里云ECS服务器上搭建Hadoop集群 简介 Hadoop是一个开源的分布式计算的基础框架,其中最主要的组成部...

  • 【hadoop】概念

    1.hadoop框架 Hadoop 是一个能够对大量数据进行分布式处理的基础框架。具有可靠、高效、可伸缩的特点。作...

  • hadoop中高可用HA的HDFS的架构分析

    一、Hadoop组成 在Hadoop 1.x版本中,Hadoop由HDFS和MapReduce组成,前者负责分布式...

  • Hadoop 学习笔记 1

    Hadoop 基本组成结构 Hadoop HDFS 分布式文件系统 Map Reduce 分布式离线并行计算框架 ...

  • 大数据day05 Hadoop

    Hadoop Hadoop是分布式的系统架构 1.Hadoop组成: Hadoop = hdfs(存储) + ma...

  • Hadoop框架基础(二)

    ** Hadoop框架基础(二) 上一节我们讨论了如何对hadoop进行基础配置已经运行一个简单的实例,接下来我们...

  • Hadoop- yarn notes

    Yarn基础架构 1 YARN产生背景 最早的hadoop是由hdfs和mr组成的,hdfs负责存储,mr负责计算...

  • Hadoop(一)---概述

    Hadoop是什么 Hadoop是一个用于海量数据存储和分析计算的分布式基础框架。不过从广义上来讲,Hadoop不...

  • 大数据技术框架

    大数据技术框架****3 1. 简介****3 2. Hadoop框架****3 2.1. Hadoop-MapR...

网友评论

      本文标题:1)Hadoop基础组成框架

      本文链接:https://www.haomeiwen.com/subject/ijvyzftx.html