美文网首页
Hadoop总览(0924)

Hadoop总览(0924)

作者: hipeer | 来源:发表于2018-09-30 17:28 被阅读0次

1. 什么是Hadoop?

Hadoop是一个开源软件框架,用于在商用硬件集群上存储数据和运行应用程序。 它为任何类型的数据提供海量存储,并且还拥有巨大的处理能力以及处理几乎无限的并发任务或作业的能力。简单点说,Hadoop就是一个对海量数据进行分布式存储和计算的平台。

  • Framework for solving data-intensive processes
  • Designed to scale massively
  • Very fast for big jobs
  • Variety of processing engines, such as Tez, Spark and Storm
  • Designed for hardware and software failures
2. Hadoop的特点
  • 性价比高:能在普通机器组成的集群中并行为大量数据提供计算
  • 可扩展:可以根据需要添加新节点,而无需更改现有数据分布,也不需要对作业和应用程序进行任何更改。
  • 容错性:如果有节点挂掉了,系统会将工作重定向到数据的另一个位置,并继续处理而不会中断
  • 灵活性:Hadoop在处理数据时才会对数据进行解释(读时模式),所以能够储存任何数据类型
3. Hadoop核心项目
  • HDFS(Hadoop分布式文件系统)
  • MapReduce(分布式并行计算框架)
4. Hadoop架构
  • 分布式存储系统HDFS
    提供高可靠性,高扩展性, 高吞吐率的数据存储
  • 分布式计算框架MapReduce
    具有易于编程,高容错性,高扩展性等优点
  • 资源管理系统YARN(Yet Another Resource Negotiator)
    负责集群资源的统一管理和调度
  • Others
5. Hadoop生态系统(2.x)
Ecosystem.jpg

相关文章

  • Hadoop总览(0924)

    1. 什么是Hadoop? Hadoop是一个开源软件框架,用于在商用硬件集群上存储数据和运行应用程序。 它为任何...

  • hadoop虚拟机全套配置攻略

    Hadoop集群安装 1总览 Hdfs(hadoop内置) 2.8.5 Yarn(hadoop内置)...

  • 0924

    1)Typhoon Mangkhut has crippled the electricity supply an...

  • 0924

    薇薇来大姨妈了

  • 0924

    远离 远离 远离 远离 远离 远离 远离 远离

  • 0924

    还有90天了。 已经少掉一个十天了。

  • 0924

    #幸福是需要修出来的~每天进步1%~幸福实修11班/14蒋春燕~江苏 20170924 【幸福三朵玫瑰】 今日3朵...

  • 0924

    无意中进来,很多次清理手机,简书一直被无心的保护着。也许,是这个名字让我们觉得轻松,挺好的软件。

  • 0924

    灵感来自SNH48的歌曲《她和她》(又名《爹系男友沈教授和他的呆萌AI女友》) 弥与匣/著 “0924,听得到我说...

  • 0924

    今天把本该月初就做的事情做完了,和几个朋友进行了月度聊天,做社群运营这么多年,能留下的朋友不多,微信列表千百人,平...

网友评论

      本文标题:Hadoop总览(0924)

      本文链接:https://www.haomeiwen.com/subject/oqcinftx.html