HDFS数据流

作者: 心_的方向 | 来源:发表于2017-09-24 16:50 被阅读55次

文件写入

image.png
  1. 客户端通过对DistributedFileSystem对象调用create()函数来创建文件
  2. DistributedFileSystem对NameNode创建一个RPC调用,在文件系统的命名空间中创建文件名,但是没有相应的数据块
  3. 在客户端写入数据时,FSDataOutputStream将数据分为一个个的数据包,并写入数据队列,同时向namenode申请一个新的block来存放数据。
  4. 将数据队列中的数据写入到一个datanode中,其余datanode之间(管道线pipeline)传数据包。
  5. 直到收到所有datanode的确认信息后,该数据包才会从确认队列删除
  6. 客户端完成所有数据包的写入后,会对数据流调用close()方法
  7. 通知namenode写入成功。

文件读取

image.png
  1. 客户端通过调用DistributedFileSystem对象的open()方法来打开希望读取的文件。
  2. DistributedFileSystem通过RPC调用namenode,确定文件起的位置。
  3. 客户端对输入流调用read()方法。
  4. 对数据流反复调用read()方法,将数据从datanode传输到客户端。
  5. 当读到block的末尾时,转而读下一个block。

文件复制

  1. NameNode发现文件的文件块不符合最小复制数或者Datanode失效时
  2. NameNode就通知DataNode相互复制文件块
  3. DataNode开始互相复制。默认的布局策略是同一个机架不同节点放一个副本、不同机架的节点上放一个副本。

相关文章

  • [Hadoop] HDFS 详解一(原理篇)

    目录 HDFS的工作机制 概述 HDFS 写数据流程 HDFS 读数据流程 NameNode的工作机制 NameN...

  • 082-BigData-10HDFS上传与下载机制

    上一篇:081-BigData-09HDFS上传与下载 一、HDFS的数据流 1、HDFS写数据流程 1)客户端向...

  • HDFS读写流程

    闲暇之余,梳理了一下HDFS的读、写数据流程。 (一)下图是HDFS读数据流程图: 1、客户端向NameNode建...

  • NEXT学院-剑指大数据面试 百度网盘分享

    01、大数据面试导学02、课程目录03、hdfs架构详解04、图解hdfs核心组件的职责05、图解hdfs写数据流...

  • 大数据技术之HDFS(四)

    HDFS 的 读写流程 4.1 HDFS 写数据流程 4.1.1 剖析文件 写入 (1)客户端通过 Distrib...

  • HDFS数据流

    文件写入 客户端通过对DistributedFileSystem对象调用create()函数来创建文件 Distr...

  • HDFS数据流

    文件读取 文件读取的大致过程是客户端向namenode获取数据块所在的datanode位置,然后去datanode...

  • HDFS数据的读写过程(重点)

    HDFS读数据流程 (1)客户端通过FileSystem.open()打开文件,相应地,在HDFS文件系统中Dis...

  • HDFS(四):HDFS 读写流程

    HDFS的写数据流程 1)客户端通过DistributedFileSystem模块想NameNode请求上传文件,...

  • HDFS数据流WordCount

    基于HDFS文件的实时计算,其实就是,监控一个HDFS目录,只要其中有新文件出现,就实时处理。相当于处理实时的文件...

网友评论

    本文标题:HDFS数据流

    本文链接:https://www.haomeiwen.com/subject/whdkextx.html