美文网首页
hdfs文件系统总体架构

hdfs文件系统总体架构

作者: chenjie901 | 来源:发表于2018-08-11 22:34 被阅读0次

hdfs分布式文件系统

要处理大数据,首先得解决海量数据的存储,在hadoop中解决海量存储的组件就是hdfs(hadoop filesystem)。是google GFS开源实现。其核心思想分而治之,将一个大文件(GB,TB)分解成多个文件块,由datanode存储文件块存储。hdfs采用master-slave架构,核心组件包括namenode,datanode。

namenode负责存储整个文件系统的命名空间,包括文件夹,文件,权限,文件对应的副本信息,文件块信息,文件块位置信息。其中文件块位置信息保持在内存中。由datanode通过heartbeat主动上报位置信息。

datanode负责实际的文件块存储,一个hdfs上的文件可能分为多个块,分别存储到不同的datanode上,每个datanode存储文件的一部分。一个文件块默认在3个datanode上存储。

hdfs架构

大致读写流程如下:

1、在发起一个文件操作前首先冲namenode获取元数据信息,比如要读写的文件的名字,路径

2、namenode返回要操作的文件元数据信息,比如,file1文件的第一个块请从datanode2上获取或写入

3、client向datanode写入或存储文件内容

可以看出整个系统中,namenode占有举足轻重的作用,所有涉及命令空间的操作都要经过namenode,

datanode还会主动上报自身的位置信息和自身存储的块的位置信息到namenode.所以namenode是一个中心,非常重要

那么namenode由于本身不存储文件块位置信息的,那么文件块位置信息从何而来呢?

1、由namenode在心跳包中主动上报

2、每次写入块数据都是经过namenode分配的,包括副本信息。

相关文章

  • hdfs文件系统总体架构

    hdfs分布式文件系统 要处理大数据,首先得解决海量数据的存储,在hadoop中解决海量存储的组件就是hdfs(h...

  • HDFS基础知识

    HDFS基础架构与核心概念 HDFS架构图 HDFS核心概念 Active NameNode(文件系统的管理节点)...

  • 分布式文件系统(HDFS)

    分布式文件系统HDFS(Hadoop Distributed File System) HDFS的架构图之基础架构...

  • 一. 介绍

    一、hadoop介绍 hadoop版本: cdh5.7.0 二、分布式文件系统HDFS 二 HDFS架构 Mast...

  • 6月01日第二十三次早课

    1.hdfs是属于什么架构 Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity ...

  • Hadoop基础

    1. Hadoop基础架构 HDFS:分布式文件系统。 MapReduce:分布式计算框架。 YARN:资源管理系...

  • 大数据开发:HDFS Namenode元数据管理

    HDFS作为分布式文件系统的代表性产品,在大数据学习当中的重要性是不言而喻的,基于Hadoop基础架构,HDFS更...

  • HDFS命令篇

    HDFS Hadoop查看文件系统 hdfs dfs ls Found 8 itemsdrwxrwxrwx -...

  • 创建hive表,快速添加测试数据,通过加载hdfs数据

    上传数据到hdfs文件系统 创建hdfs文件系统文件夹 导入本地的文件到hdfs 查看刚才创建的test文件夹是否...

  • 通过API访问HDFS

    通过API操作HDFS 今天的主要内容 HDFS获取文件系统 HDFS文件上传 HDFS文件下载 HDFS目录创建...

网友评论

      本文标题:hdfs文件系统总体架构

      本文链接:https://www.haomeiwen.com/subject/ywhjbftx.html