HDFS工作原理

作者: 无羡爱诗诗 | 来源:发表于2018-12-18 20:35 被阅读2次

What is HDFS?

HDFS源自于2003年10月Google发表的一篇GFS论文,他是GFS的克隆版。HDFS是一个可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。

HDFS基本可以认为是GFS的简化版,由于时间及应用场景等各方面的原因对GFS的功能做了一定的简化,大大降低了复杂度。

HDFS为了更好地服务于应用,提供了类似Linux命令的Shel接口和API接口。此外,HDFS还可以通过HTTP协议支持用户通过浏览器客户端对HDFS平台上的文件和数据进行检索。

经典传统分布式储存模式与HDFS存储模式的比较

分布式系统存储文件的特点:

文件太大,一个机器的空间不足,可以将文件分割为小块儿然后保存到多台机器上;另外,还可以在不同机器上对文件进行备份,避免因为机器损坏文件丢失。

传统的分布式存储模式也可以做到以上两点,但是存储一些问题:负载难以均衡。

HDFS的出现就是为了解决负载均衡。它会将文件切割成大小相同的块(Bolck),默认情况下是128MB。

Apache HDFS的特点

1)功能强大,操作简单、易用;

2)良好的扩展性;

3)高容错性;

4)支持流式数据访问;

5)适合PB级以上海量数据存储;

6)异构硬件平台间的可移植性。

HDFS的体系结构

HDFS采用master/slave架构。

一个HDFS集群由一个NameNode和一定数目的DataNode组成。

NameNode是一个中心服务器---master机,负责管理文件系统的命名空间及客户端对文件的访问;

DataNode是集群中的slave机,每个slave机充当一个node,启动一个DataNode的守护进程,负责管理本机上的存储。

关键词:Client、Metadata(元数据)、NameNode、DataNode、Block、Rack、Replication(复制)

相关文章

  • HDFS 工作原理

    HDFS 工作原理 HDFS 架构 如上图所示,HDFS也是按照Master和Slave的结构。分NameNode...

  • HDFS工作原理

    What is HDFS? HDFS源自于2003年10月Google发表的一篇GFS论文,他是GFS的克隆版。H...

  • HDFS工作原理漫画

    转载,侵删 数据写入过程: 数据读取过程: HDFS容错part1:错误类型及检测 HDFS容错part2:数据读...

  • 漫画HDFS工作原理

    http://blog.csdn.net/netcoder/article/details/7442779

  • 成都大数据开发技术知识点,加米谷大数据培训

    Hadoop核心 (1) 分布式存储基石:HDFS HDFS简介 入门演示 构成及工作原理解析:数据块,NameN...

  • 福利!大数据技术框架整理

    大数据离线部分 HDFS 1:HDFS的架构部分及工作原理 NameNode:负责管理元素据,将信息保存在内存中 ...

  • HDFS工作机制和原理

    HDFS是一种分部式的文件系统,在他出现以前就已经存在了很多中分布式文件系统,但是他们都是部署在服务器上,需要高的...

  • hadoop HDFS原理 解析

    hadoop HDFS原理解析01 HDFS架构•NameNode•DataNode•Sencondary Nam...

  • HDFS HA 原理

    HDFS HA 原理 标签:HDFS HA 概述 在 Hadoop 2.x 版本中,Hadoop 实现了 HDFS...

  • 图文详解HDFS工作机制

    本篇主要从下面几个方面进行展开 HDFS是什么 漫画看懂HDFS骚操作 HDFS架构原理 一、HDFS是什么 HD...

网友评论

    本文标题:HDFS工作原理

    本文链接:https://www.haomeiwen.com/subject/fgqrkqtx.html