美文网首页
MapReduce学习

MapReduce学习

作者: HannahLi_9f1c | 来源:发表于2019-12-01 21:02 被阅读0次

最近学习了分布式老三篇之一MapReduce,是用于分布式计算的。

  1. MapReduce出现的背景
    数据量十分多的时候,单机很难在较短的时间内返回计算结果,比如说网页抓取、倒排排序、日志处理等等。所以Google基于这样的背景提出了MapReduce的创新式的方式。
  2. MapReduce工作原理
    MapReduce中采用的是分而治之的思想,将海量数据进行分发,然后进行汇总。用户提交的数据会传到master(主节点),然后master节点把它分到可用的worker节点进行Map,这里的map会将用户提交的信息进行初步处理,得到中间结果,返回给master节点。然后master节点进一步寻找可以reduce的worker节点。这个reduce函数会将上一步得到的结果进行汇总得到结果返回给Master节点。
  3. MapReduce的容错处理
    worker节点挂掉的话,可以再寻找其他的worker,但是master挂掉的话,就只能是提醒用户进行重启。
  4. MapReduce与内存、缓存、磁盘、网络的关联
    有待研究
  5. MapReduce如何配置才更加合理

相关文章

  • MapReduce学习

    最近学习了分布式老三篇之一MapReduce,是用于分布式计算的。 MapReduce出现的背景数据量十分多的时候...

  • mapreduce框架详解

    参考:hadoop 学习笔记:mapreduce框架详解 [toc] 总结 Mapreduce是一个计算框架,既然...

  • Spark编程模型

    Spark简述 下图是Spark和MapReduce进行逻辑回归机器学习的性能比较,Spark比MapReduce...

  • MapReduce执行过程及shuffle详解

    开始学习Hadoop时,经常会听到MapReduce。MapReduce由Map和Reduce两个阶段,每个阶段都...

  • Hadoop MapReduce 学习笔记

    前言 本文是个人之前纪录的MapReduce学习笔记,主要涉及到MapReduce基本概念、Hadoop 经典示例...

  • hadoop(八)MapReduce

    上一节课我们一起学习了RPC简单用法,这节课我们来学习MapReduce,MapReduce可谓是Hadoop当中...

  • 大数据开发:MapReduce排序与合并机制

    MapReduce作为Hadoop的核心计算引擎,算是学习当中必学的一个部分。虽然发展至今,MapReduce计算...

  • mapreduce学习笔记

    本文是对mapreduce技术的一个初步学习的总结,包括如下章节的内容: 概述 发展史 基本概念 程序编写 运行测...

  • MapReduce学习笔记

    wordcount: 统计文件中每个单词出现的次数需求:1) 文件内容小:shell2)文件内容很大:TB GB ...

  • MapReduce学习笔记

    MapReduce 一、什么是MapReduce 1.1 定义: MapReduce是Google提出的一个软件架...

网友评论

      本文标题:MapReduce学习

      本文链接:https://www.haomeiwen.com/subject/uadtgctx.html