美文网首页
Mapreduce运行步骤

Mapreduce运行步骤

作者: Carver_c5f0 | 来源:发表于2017-08-15 23:06 被阅读0次

      MapReduce的工作过程主要分为两个阶段:map阶段和reduce阶段。每个阶段都是键值对最为输入和输出,而通常定义map函数和reduce函数。

比如一个气象收集频平台,通过Map函数找出年份和气温,map主要是建立数据使用Reduce能够在这个基础上运行,并且初步进行数据清洗,比如去丢一些缺失的,不可靠的气温数据

比如下面输入几行示例输入数据

对应的是input的键值对<k1,v1>其中k1代表的是偏移量,而v1代表的是数据。

然后根据上面的input提取出年份和气温提取数据(粗体显示)

相关文章

网友评论

      本文标题:Mapreduce运行步骤

      本文链接:https://www.haomeiwen.com/subject/gkkmrxtx.html