简介

作者: chrisghb | 来源:发表于2021-01-06 15:10 被阅读0次

hadoop生态圈

  • HDFS(分布式文件系统)源自于Google的GFS论文,优点是可以在任何机器上运行,廉价
  • MapReduce(分布式计算和分析框架)源自于Google的MapReduce论文,由map端和reduce端组成,键值对的形式
  • Hbase(分布式列存数据库)源自Google的BigTable论文,采用key和value的形式,key由行关键字、列关键字、时间戳组成,提供了随机实时读写
  • Zookeeper(分布式协作服务)源自Google的Ghubby论文,解决分布式环境下集群的管理
  • Hive(数据仓库)由Facebook开源,将HQL转化为MapReduce任务在Hadoop上执行,通常用于离线分析
  • Flume(日志收集工具)是Cloudera开源的日志系统收集系统,在收集的过程中会执行简单的处理,过滤和格式的转换
  • Spark(内存DAG计算模型)是一个Apche项目,被标榜为“快如闪电的集群计算引擎”
  • Kafka(分布式消息队列)是Linkedin于2010年12月开源的消息系统,主要用于处理活跃的流式数据

相关文章

  • 18旅游二班各组自我简介汇总

    一组简介 二组简介 三组简介 四组简介 五组简介 六组简介 七组简介 八组简介

  • 简介

    上辈子,洛幽喜欢了东凡一辈子,没有结果,之后她死了,她不后悔,只是为什么她一睁眼,嗯?捏了捏自己的脸,她这是回到了...

  • 简介

    1.主动地去阅读。 2.阅读目的:获得资讯,获得理解 前者为了增进资讯,获得信息,不能增加理解力。后者为了理解更多...

  • 简介

    姓名:赵金星 电话:13903984903 坐标:河南三门峡市陕州区。 三个标签的自我介绍: 1.时间管理践行者 ...

  • 简介

    朱凝不过打错个字,便被天打雷劈回古代。 为毛别人穿个废柴嫡女,她穿个废柴庶女?地位更低了哎 哇喔,别人嫁王爷,她嫁...

  • 简介

    凌波网络考试系统,是一套运行于Windows系统之上的无纸化网络考试软件。包括试卷编辑、分发试卷、学生答卷、自动阅...

  • 简介

    名字:笨小孩 不是富二代的笨小孩为了生活选择了编程。在大多数人眼里可能感觉编程是很无聊很辛苦经常加班的事情,其实人...

  • 简介

    A Native Client web application consists of JavaScript, H...

  • 简介

    选择django作为毕设项目,和日后工作内容。故在简单得做了一个blog和毕设系统之间,想深入了解django,会...

  • 简介

    被乞丐养大的孩子,像是被贴上来了另类的标签,即使成绩优异也无人与她作伴,一头乌黑的长发,明亮却又冷漠的眼睛,本...

网友评论

      本文标题:简介

      本文链接:https://www.haomeiwen.com/subject/nvgnoktx.html