美文网首页
HDFS读写数据流程

HDFS读写数据流程

作者: 鄙人王道长 | 来源:发表于2020-03-05 15:05 被阅读0次

HDFS中的block、packet、chunk

  1. Block
    这个大家应该知道,文件上传前需要分块,这个块就是block,一般为128MB。
  2. packet
    packet是第二大的单位,它是client端向DataNode,或DataNode的PipLine之间传数据的基本单位,默认64KB。
  3. chunk
    chunk是最小的单位,它是client向DataNode,或DataNode的PipLine之间进行数据校验的基本单位,默认512Byte,因为用作校验,故每个chunk需要带有4Byte的校验位。所以实际每个chunk写入packet的大小为516Byte。

HDFS读数据流程

在这里插入图片描述

注意:

  1. datanode根据它们与客户端的距离(集群的网络拓扑)来进行排序。
  2. FSdataInputStream根据datanode的距离顺序读取数据块,每读完一个块,即关闭与该datanode的链接。
  3. FSdataInputStream与datanode的数据以packet为基本单位。

HDFS写流程

在这里插入图片描述

注意:

  1. 文件在客户端完成逻辑分片
  2. DistributedFileSystem向namenode请求上传文件时,namenode会检查是否已存在文件及文件读写权限。若通过检查,直接先将操作写入EditLog。
  3. 数据packet在datanode中会先写入ByteBuffer中,在由ByteBuffer写入block中
  4. 当第一个datanode完成数据写入后即返回应答,不必等所有的datanode都完成数据写入。

相关文章

  • Hadoop HDFS 数据读写流程分析

    本文转载自《Hadoop HDFS 数据读写流程分析》,该文对Hdfs的读写流程分析之简洁明了,令人叹服。 HDF...

  • 大数据技术之HDFS(四)

    HDFS 的 读写流程 4.1 HDFS 写数据流程 4.1.1 剖析文件 写入 (1)客户端通过 Distrib...

  • HDFS MapReduce

    hdfs的读写流程 hdfs写数据 1) 客户端通过DistributedFileSystem模块向namenod...

  • 大数据学习十二:HDFS读流程和写流程

    HDFS读写流程相对于HDFS Client而言,所以读流程为FSDataInputStream , 写流程为FS...

  • Hadoop 基础(二)

    HDFS 读写流程 我们知道在HDFS中我们的文件按数据块进行存储,那么当我们写入或者读取一个文件的时候HDFS到...

  • HDFS读写数据流程

    HDFS中的block、packet、chunk Block这个大家应该知道,文件上传前需要分块,这个块就是blo...

  • Hadoop 源码学习笔记(4)--Hdfs 数据读写流程分析

    Hdfs 的数据模型 在对读写流程进行分析之前,我们需要先对 Hdfs 的数据模型有一个简单的认知。 如上图所示,...

  • Hadoop学习2

    HDFS读写流程 写的流程: MapReduce运行流程 WordCount案例 WordCount程序演示 创建...

  • HDFS读写流程

    1、HDFS读流程 1、首先调用FileSystem对象的open()方法,其实获取的是一个Distributed...

  • HDFS读写流程

    (一)HDFS的读流程 读操作对于Client客户端来说是透明操作,感觉就是连续的数据流 1、Client客戶端先...

网友评论

      本文标题:HDFS读写数据流程

      本文链接:https://www.haomeiwen.com/subject/ruqfrhtx.html