美文网首页
HDFS之namenode、shuffle机制

HDFS之namenode、shuffle机制

作者: 小月半会飞 | 来源:发表于2018-12-28 18:55 被阅读0次

    第一部分 namenode和shuffle

    image.png

    第二部分 shuffle机制

    1、shuffle操作

    1、这个过程是在有map任务的节点上完成的
    image.png

    注意:默认单词分区规则:hashcode值/ReduceTask个数=单词的hashcode值的取模数,比如ReduceTask是3,那么单词就要分成3个区,每个单词的hashcode值除以3,将单词进行分区,相同单词的hashcode值是一样的

    2、这个过程是在有reduce任务的节点上完成的。
    image.png

    2、reduce操作

    reduceTask默认一个,设置几个最后输出文件就有几个


    image.png

    3、文件写入HDFS

    image.png

    相关文章

      网友评论

          本文标题:HDFS之namenode、shuffle机制

          本文链接:https://www.haomeiwen.com/subject/gamelqtx.html