Java大数据学习~Hadoop初识二读取与写入流程

Java大数据学习~Hadoop初识二读取与写入流程

作者: 胖琪的升级之路 | 来源:发表于2018-06-19 23:42 被阅读27次

昨天的文章我们简单的说了下Hadoop中HDFS的内容，今天我们来了解下HDFS的都写入流程。当然该流程也是一个经常面试遇到的一个问题。

HDFS的写入流程

在HDFS客户端想要往HDFS写入文件，流程如下

写入数据流程图

首先客户端发送请求，携带者配置文件信息，还有文件的路径
访问到NameNode后，NameNode根据文件路径，去查看该路径是否存在，不存在继续将文件进行Block切割还有DataNode信息。存在追缴内容到对应的文件上
3.客户端接收到NameNode信息后，根据返回的Block信息访问到最近的DataNode上，打开Socket链接，进行访问，然后一个DataNode会接着链接第二个DataNode，第二个会继续链接第三个将pipeline链接构成，再返回给客户端。
client开始传输数据到最近的DataNode上传输第一个Block，按照一个包packet为64K的大小进行写入，在写入的时候会进行数据校验，防止数据写入出现错误的问题。然后形成链式操作到第三个datanode上结束。
一个Block传输完毕后，再回接着传输第二个Block。到对应的DataNode上。
整个流程就会循环的执行，传输完毕整个文件。
最后关闭链接的访问，告知namenode完成任务。

HDFS的读取过程

读取过程

客户端访问NameNode，根据发送的路径进行检查。
存在 ,返回给客户端Block还有存储的DataNode信息。不存在，返回给客户端异常信息
客户端根据发送的Block还有DataNode信息，与其建立Socket链接，DataNode开始发送数据，还是按照packet来作为单位进行校验。
本地客户端进行接收。先缓存下来、然后根据块进行数据汇总。完成读取操作。
最后关闭链接的访问。

相关文章

网友评论

本文标题：Java大数据学习~Hadoop初识二读取与写入流程

本文链接：https://www.haomeiwen.com/subject/yjwzeftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

写作与程序

大数据爬虫Python AI Sql

玩转大数据

热点阅读

写作与程序

大数据爬虫Python AI Sql

大数据

玩转大数据

程序员

我爱编程

关于我们|服务条款|联系我们|Java大数据学习~Hadoop初识二读取与写入流程|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！