Mapreduce

作者: 徐超Change | 来源:发表于2017-07-24 11:06 被阅读5次

    一句话总结:Mapreduce的原理就是一个归并排序。Hadoop是一个实现了MapReduce模式的开源的分布式并行编程框架。

    Map是一个拆解数据块的过程,把数据拆成:<key1,value1>这样的函数对,然后按key的值来分配数据到各自的机器上分开运算,返回<key2,list(value2)>;
    reduce就是算完之后,要返回结果,需要总结每个机器上的结果,就和归并的过程一样,输入<key2,list(value2)>,返回<key3,value3>

    相关文章

      网友评论

          本文标题:Mapreduce

          本文链接:https://www.haomeiwen.com/subject/mdzvkxtx.html