美文网首页
HDFS 块和 Input Splits 的区别与联系

HDFS 块和 Input Splits 的区别与联系

作者: 这个该叫什么呢 | 来源:发表于2018-05-17 11:47 被阅读0次

    HDFS 块和 Input Splits 的区别与联系
    HDFS 块和 Input Splits 的区别与联系(源码版)

    • Split 和 HDFS Block 是一对多的关系;
    • HDFS block 是数据的物理表示,而 Split 是 block 中数据的逻辑表示;
    • 满足数据本地性的情况下,程序也会从远程节点上读取少量的数据,因为存在行被切割到不同的 Block 上。

    因为存在某些行数据跨block,读取每个 Block 的时候都会从下一个 Block 多读取一行的数据,也就是说 in.read(buffer); 操作会读取两个 block 的数据。

    相关文章

      网友评论

          本文标题:HDFS 块和 Input Splits 的区别与联系

          本文链接:https://www.haomeiwen.com/subject/hehbdftx.html