美文网首页
大数据基础知识--Hadoop基础

大数据基础知识--Hadoop基础

作者: Amy1234567 | 来源:发表于2021-06-30 23:14 被阅读0次

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。

主要解决,海量数据的存储和海量数据的分析计算问题。

广义来说,Hadoop通常是指一个更广泛的概念--Hadoop生态圈

尚硅谷

Google在大数据方面的三篇论文

GFS-->HDFS

Map-Reduce-->MR

BigTable-->HBase

Hadoop三大发行版本:Apache, Cloudera, Hortonworks

Apache版本最原始(最基础)的版本,对于入门学习最好。

Cloudera在大型互联网企业中用的较多。(CDH版框架)

Hortonworks文档较好。

Hadoop1.x和Hadoop2.x的区别

尚硅谷

HDFS架构概述

Hadoop Distributed File System, 简称HDFS, 是一个分布式文件系统。

1. NameNode(nn):存储文件的元数据,如文件名,文件目录结构,文件属性(生成时间,副本数,文件权限),以及每个文件的块列表和块的DataNode等。

2. DataNode(dn):在本地文件系统存储文件块数据,以及块数据的校验和。(实实在在存储的数据)

3. Secondary NameNode(2nn):用来监控HDFS状态的辅助后台程序,每隔一段时间获取HDFS元数据的快照。

YARN架构概述

Yet Another Resource Negotiator,简称YARN,另一种资源协调者,是Hadoop的资源管理器。

1. ResourceManager(RM)主要作用如下:(整个集群资源,CPU,内存等,的老大)

(1). 处理客户端请求

(2). 监控NodeManager

(3). 启动或监控ApplicationMaster

(4). 资源的分配与调度

2. NodeManager(NM)主要作用如下:(单个节点服务器资源的老大)

(1). 管理单个节点上的资源

(2). 处理来自ResourceManager的命令

(3). 处理来自ApplicationMaster的命令

3. ApplicationMaster(AM)作用如下(单个任务运行的老大)

(1). 负责数据的切分

(2). 为应用程序申请资源并分配给内部的任务

(3). 任务的监控与容错

4. Container(容器,相当于一台独立的服务器)

Container是YARN中的资源抽象,它封装了某个节点上的维度资源,如内存,CPU,磁盘,网络等。

尚硅谷

说明:

(1). 客户端可以有多个

(2). 集群上可以运行多个ApplicationManager

(3). 每个NodeManager上可以有多个Container

MapReduce架构概述

MapReduce将计算过程分为两个阶段: Map和Reduce

1. Map阶段并行处理数据

2. Reduce阶段对Map结果进行汇总

大数据技术生态体系

尚硅谷

相关文章

  • Hadoop集群环境搭建

    前言 Hadoop在大数据技术体系中的地位至关重要,Hadoop是大数据技术的基础,对Hadoop基础知识的掌握的...

  • Hadoop安装

    前言 Hadoop在大数据技术体系中的地位至关重要,Hadoop是大数据技术的基础,对Hadoop基础知识的掌握的...

  • Hadoop集群环境搭建

    前言 Hadoop在大数据技术体系中的地位至关重要,Hadoop是大数据技术的基础,对Hadoop基础知识的掌握的...

  • Hadoop集群搭建

    前言 Hadoop在大数据技术体系中的地位至关重要,Hadoop是大数据技术的基础,对Hadoop基础知识的掌握的...

  • 大数据 | 史上最详细的Hadoop环境搭建

    Hadoop在大数据技术体系中的地位至关重要,Hadoop是大数据技术的基础,对Hadoop基础知识的掌握的扎实程...

  • HADOOP环境搭建示例-1

    Hadoop在大数据技术体系中的地位至关重要,Hadoop是大数据技术的基础,对Hadoop基础知识的掌握的扎实程...

  • 大数据基础知识学习

    大数据基础知识学习 文件存储:Hadoop HDFS、Tachyon、KFS 离线计算:Hadoop MapRed...

  • Hadoop学习笔记

    一、Hadoop基础知识:(主要解决海量数据存储和海量数据分析计算) 1、Hadoop的优势: 1)高可靠性:因为...

  • hadoop入门系列--用java代码实现创建hbase表

    传送门hadoop入门系列--hbase基础知识点hadoop入门系列--从本地把数据导入Hbasehadoop入...

  • hadoop入门系列--hbase基础知识点

    传送门hadoop入门系列--hbase基础知识点hadoop入门系列--从本地把数据导入Hbasehadoop入...

网友评论

      本文标题:大数据基础知识--Hadoop基础

      本文链接:https://www.haomeiwen.com/subject/seurultx.html