美文网首页
Spark及其生态圈概述

Spark及其生态圈概述

作者: CrUelAnGElPG | 来源:发表于2018-05-09 16:55 被阅读0次

    MapReduce的局限性:

    1)代码繁琐;

    2)只能够支持map和reduce方法;

    3)执行效率低下;

    4)不适合迭代多次、交互式、流式的处理;

    框架多样化:

    1)批处理(离线):MapReduce、Hive、Pig

    2)流式处理(实时): Storm、JStorm

    3)交互式计算:Impala

    学习、运维成本无形中都提高了很多

    ===> Spark

    ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

    BDAS:Berkeley Data Analytics Stack

    相关文章

      网友评论

          本文标题:Spark及其生态圈概述

          本文链接:https://www.haomeiwen.com/subject/ilkorftx.html