美文网首页
关于MapReduce的三大阶段、八大步骤

关于MapReduce的三大阶段、八大步骤

作者: 八爪鱼下水 | 来源:发表于2021-04-27 19:21 被阅读0次

    mapreduce的三大阶段:

    map阶段:并行处理的阶段
    shuffle阶段:从离开Mapper开启到进入Reduce之前的阶段
    reduce阶段:汇总整理的阶段
    mapreduce的八大步骤

    设置MapReduce的输入InputFormat类型,默认为TextInputFormat
    自定义map函数,得到TextInputFormat的k1,v1;经过处理后传出k2,v2
    分区--默认根据k2决定map中的数据该发送到哪个reduce中
    排序--默认根据k2进行字典排序
    规约--默认没有此阶段,是优化手段,可以提前合并
    分组--相同k2的value会放到同一个集合中
    自定义reduce函数,讲分组得到的k2,v2转成k3,v3输出
    设置输出的OutputFormat,默认采用TextOutputFormat,将结果输出到一个纯文本文件中
    ————————————————
    版权声明:本文为CSDN博主「东城庞太师」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    原文链接:https://blog.csdn.net/u011110301/article/details/104116052

    相关文章

      网友评论

          本文标题:关于MapReduce的三大阶段、八大步骤

          本文链接:https://www.haomeiwen.com/subject/tsyprltx.html