美文网首页
MapReduce(6)特性

MapReduce(6)特性

作者: 大飞飞_s8 | 来源:发表于2019-08-19 23:47 被阅读0次

##08.20

1、计数器

1.1、MapReduce包含的高级特性,计数器,数据集的排序和连接

1.2、计数器作用,收集作业统计信息,质量控制或者应用级统计,辅助诊断系统故障

1.3、计数器分组 MapReduce任务计数器、文件系统计数器、fileinputformat计数器、fileoutputformat计数器、作业计数器,各组要么包含任务计数器。要么包含作业计数器

1.4、任务计数器,任务执行活成中采集任务相关信息,每个作业所有任务结果会被聚集起来,例如map_input_records

1.5、任务计数器每次传输给master都是完成的传输,而非自上次传输之后的计数值,避免消息丢失引发错误,任务执行期间失败,相关计数器值会减小

1.6、作业计数器由master维护,无需网络间传输数据

1.7、java可以自定义计数器,如,数据不规范记录计数器

2、排序

2.1、排序是MapReduce的核心计数,尽管应用本身可能不需要排序,但是仍可能使用MapReduce排序功能组织数据

2.2、部分排序、全排序、辅助排序

3、连接

3.1、MapReduce能执行大型数据间的连接操作,如果由mapper连接,则是mapper端连接,如果由reducer连接,则称为reduce端连接

3.2、map端连接:map函数执行执行连接,各个map输入数据必须先分区并且以特定方式排序。各个输入数据集会被划分成相同数量的分区,并且按照相同的连接键排序。同一键的所有记录均会放在同一分区之中

3.3、reduce端连接:由于reduce端连接并不要求输入数据集符合特定结构,因为更为常用。因为需要经过shuffle,所以效率会低一些。mapper为各个记录标记源,并使用连接键作为map输出键,相同键的记录放在同一个reducer中


上回半信史时代讲完,此回话信史时代

公元前九世纪五十年代,半信史时代结束,文字记载妥善保存,信史时代开始

周朝第十任国王姬胡 周厉王时期,公元前842年发生政变,国王出逃

周王朝受西北犬戎部落攻击,几乎灭亡,十二任王姬宫涅(周幽王)被杀,首都从镐京东迁洛阳,国王权威迅速衰微。

七十年代,进入历时二百余年春秋时代,知道公元前五世纪末

东迁后,史学家称为东周,之前称为西周

相关文章

  • MapReduce(6)特性

    ##08.20 1、计数器 1.1、MapReduce包含的高级特性,计数器,数据集的排序和连接 1.2、计数器作...

  • MapReduce

    MapReduce原理与特性 源自于Google的MapReduce论文发表与于2014年12月Hadoop Ma...

  • 4、Spark概要

    一、基本特性 1、与MapReduce的不同 不同于MapReduce的是Job中间输出和结果可以“保存在内存”中...

  • Hive调优 | Hive常见的几种优化模式

    Hive和MapReduce中拥有较多在特定情况下优化的特性,如何利用好相关特性,是Hive性能调优的关键。本文就...

  • Hive 调优,先掌握这几种优化模式

    Hive和MapReduce中拥有较多在特定情况下优化的特性,如何利用好相关特性,是Hive性能调优的关键。本文就...

  • Hadoop相关文章索引(1)

    基本常识 Hadoop默认端口应用一览 hadoop-3.0新特性 Mapreduce中Combiner的使用及误...

  • 大数据学习day_5

    思考问题 MapReduce总结 MapReduce MapReduce的定义MapReduce是一种编程模型, ...

  • MapReduce入门

    MapReduce 1.x架构、MapReduce2.x架构 MapReduce1.x架构 MapReduce2....

  • 【2019-05-09】MapReduce的特性

    计数器内置计数器 任务计数器采集任务的相关信息,每个作业的所有任务的结果会被聚集起来。任务计数器由其关联任务维护,...

  • MapReduce 原理分析

    MapReduce 分析 User 请求 MapReduce 处理,MapReduce 接收到 User 的文件,...

网友评论

      本文标题:MapReduce(6)特性

      本文链接:https://www.haomeiwen.com/subject/tubysctx.html