【Mac大数据开发】第三篇-Hadoop概论

【Mac大数据开发】第三篇-Hadoop概论

作者: irving_yuan | 来源:发表于2019-06-26 07:20 被阅读1次

【Mac大数据开发】第三篇-Hadoop概论
hadoop之踩坑记录--在mac系统上装hadoop生态
大数据开发指南
学习大数据必须了解的大数据开发课程大纲
大数据开发课程大纲
零基础如何开始学大数据专业？
学习大数据必须了解的大数据开发课程大纲
学习大数据必须了解的大数据开发课程大纲
Mac OS X上搭建伪分布式CDH版本Hadoop开发环境
Mac OS X上搭建伪分布式CDH版本Hadoop开发环境

1.Hadoop起源

Lucene的一个子项目
思想源于Google的三篇论文
GFS - HDFS 分布式文件系统
Map-Reduce - MR 分布式计算框架
Big-Table - Hbase

2.Hadoop的优势

高可用
几乎所有结构都是主从模式的，数据存在副本和备份，保证高可用
高扩展性
在集群间分布式的分配数据方案，支持扩展到数千台服务器
高效
Map-Reduce并行计算，提高计算效率
高容错性
自动保存多个数据副本，能够自动将执行失败的任务重新分配

3.Hadoop的组成

HDFS
一个高可用，高吞吐量的分布式文件系统
MapReduce
一个分布式的离线并行计算框架
Yarn
任务调度与集群资源管理的框架
Common
一些基础的支持模块功能（RPC、序列化机制、Configuration、日志等）

hadoop的组成部分

4.HDFS架构概述

HDFS系统具有一下几种角色的节点

NameNode（nn）：命名节点，存储各节点的元数据信息（基础信息，如IP地址等）
DataNode（dn）：数据节点，存储数据块
SecondaryNode（sn）：监控NameNode元数据，定期合并元数据，在异常情况下升级成为NameNode

5.Yarn架构概述

Yarn集群中，节点主要包含4个角色（前两个是核心）

ResourceManager（rm）：处理客户端请求，监控ApplicationMaster
NodeManager（nm）：单个节点上的资源管理，处理再自ResourceManger、ApplicationMaster的指令
ApplicationMaster：数据切分，为应用程序申请资源，任务监控
Container：对任务运行环境的抽象

6.MapReduce架构概述

MapReduce将计算过程分成两个阶段
Map对数据并行处理
Reduce阶段对Map的结果进行整合汇总

相关文章

【Mac大数据开发】第三篇-Hadoop概论
1.Hadoop起源 Lucene的一个子项目思想源于Google的三篇论文GFS - HDFS 分布式文件系统...
hadoop之踩坑记录--在mac系统上装hadoop生态
起因是这样，因为开发需求，得在mac上安装hadoop、hbase、hive等大数据开发环境在mac上装环境，你...
大数据开发指南
package 数据开发/大数据开发/hadoop开发架构： public class(终极目标)： class ...
学习大数据必须了解的大数据开发课程大纲
大数据开发最核心的课程就是Hadoop框架，几乎可以说Hadoop就是大数据开发。这个框架就类似于Java应用开发...
大数据开发课程大纲
大数据开发最核心的课程就是Hadoop框架，几乎可以说Hadoop就是大数据开发。这个框架就类似于Java应用开发...
零基础如何开始学大数据专业？
大数据开发最核心的课程就是Hadoop框架，几乎可以说Hadoop就是大数据开发。这个框架就类似于Java应用开发...
学习大数据必须了解的大数据开发课程大纲
大数据开发最核心的课程就是Hadoop框架，几乎可以说Hadoop就是大数据开发。这个框架就类似于Java应用开发...
学习大数据必须了解的大数据开发课程大纲
大数据开发最核心的课程就是Hadoop框架，几乎可以说Hadoop就是大数据开发。这个框架就类似于Java应用开发...
Mac OS X上搭建伪分布式CDH版本Hadoop开发环境
最近在研究数据挖掘相关的东西，在本地 Mac 环境搭建了一套伪分布式的 hadoop 开发环境，采用CDH发行版本...
Mac OS X上搭建伪分布式CDH版本Hadoop开发环境
最近在研究数据挖掘相关的东西，在本地 Mac 环境搭建了一套伪分布式的 hadoop 开发环境，采用CDH发行版本...

网友评论

本文标题：【Mac大数据开发】第三篇-Hadoop概论

本文链接：https://www.haomeiwen.com/subject/ltsfcctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

大数据，机器学习，人工智能

Mac学习大数据

玩转大数据

热点阅读

大数据，机器学习，人工智能

Mac学习大数据

玩转大数据

大数据

关于我们|服务条款|联系我们|【Mac大数据开发】第三篇-Hadoop概论|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！