美文网首页
Java的MapReduce实现:Reduce详解

Java的MapReduce实现:Reduce详解

作者: 追寻者的小憩书铺 | 来源:发表于2018-09-16 22:42 被阅读375次

    了解了Map在Java中实现的方法之后,我们再来看一个MapReduce最后结束时的组件:Reducer。

    原理


    详细的原理介绍已经在系列的另一篇文章《5分钟掌握大数据:MapReduce》里面说过了,下面我们简单介绍一下:

    Reduce的任务是对Map打好标签的数据执行具体的计算。

    Reduce的任务根据具体业务的不同,可能只是简单的去重统计、计数求和;也有可能是复杂的算法运算。比如,如果你要统计一天的销售额,那么Reducer的任务就是要对Map按天分配过来的数据进行求和等。

    代码详解


    在进行具体的业务代码编写之前,让我们先看一下Java中对于Reducer的实现。

    我们先来精简一下最简单的逻辑,来看看java中如何定义的Reducer

    java中Reducer精简定义

    1 传入的四个参数:输入输出类型说明,详情见另一篇文章。

    2 内部实现:

    声明了类Context,传递了四个泛型,分别是输入的key类型、输入的value类型、输出的key类型、输出的value类型。

    定义了四个方法:

    setup:定义Reducer的启动工作,比如读入一些配置、进行一些变量的初始化等

    reduce:定义实际的Reducer阶段功能,比如数据读入、处理、打标签、分发等

    cleanup:定义Reducer阶段之后收尾工作,比如多路输出等。

    run:实际执行程序的方法,先调用setup完成启动工作,然后调用reduce完成实际的Reducer阶段功能,在所有reduce工作都完成之后,调用cleanup完成收尾工作。

    如何写Reducer


    最小实现

    MiniTest.java

    java中reduce的最小实现

    接下来我们一行一行的来看:

    java中reduce的最小实现的注释版

    了解了最小实现之后,我们来看一个最经典的例子:WordCountReducer.java

    WordCount在java中的reduce实现

    补充:官方完整定义


    Reducer官方定义

    文集链接

    30分钟学会java编写mapreduce

    文章链接

    5分钟掌握大数据:MapReduce

    Java的MapReduce实现:Mapper详解

    Java的MapReduce实现:Reduce详解

    Java的MapReduce实现:Combine详解

    Java的MapReduce之计数器使用

    相关文章

      网友评论

          本文标题:Java的MapReduce实现:Reduce详解

          本文链接:https://www.haomeiwen.com/subject/bzxcgftx.html