美文网首页读书
Hadoop的前世今生

Hadoop的前世今生

作者: LiJiaSi | 来源:发表于2021-05-26 15:17 被阅读0次

随着数据的快速增长,数据的存储和分析都变的越来越困难。例如存储容量、读写速度、计算效率等都无法满足用户的需求。为了解决这些问题,Google提出了三个处理大数据的技术手段,分别是:

l MapReduce::Google的MapReduce开源分布式并行计算框架

l BigTable:一个大型的分布式数据库

l GFS:Google的分布式文件系统

上述三大技术可以说是革命性的技术,具体表现在:

(1) 成本降低、能用PC机,就不用大型机和高端存储。

(2) 软件容错硬件故障视为常态,通过软件保证可靠性。

(3) 简化并行分布式计算,无须控制节点同步和数据交换。

在2003至2004年,Google陆续公布了部分GFS和MapReduce思想的细节,Nutch的创始人Doug Cutting受到启发,用了若干年时间实现了DFS和MapReduce机制,使Nutch性能飙升。

2005年,Hadoop作为Lucene子项目Nutch的一部分正式被引入Apache基金会,随后又从Nutch中剥离,成为一套完整独立的软件,起名为Hadoop。据说,Hadoop这个名字来源于创始人Doug Cutting儿子的毛绒玩具大象,因此,Hadoop的Logo形象如下图。

Hadoop  LOGO

目前,Hadoop已经正式成为Apache顶级开源项目,俨然已经成为大数据处理技术的核心地位。下面我们回顾一下近10年来Hadoop的主要发展历程。

2008年1月,Hadoop成为Apache顶级项目。

2008年6月,Hadoop的第一个SQL框架——Hive成为了Hadoop的子项目。

2009年7月 ,MapReduce 和 Hadoop Distributed File System (HDFS) 成为Hadoop项目的独立子项目。

2009年7月 ,Avro 和 Chukwa 成为Hadoop新的子项目。

2010年5月 ,Avro脱离Hadoop项目,成为Apache顶级项目。

2010年5月 ,HBase脱离Hadoop项目,成为Apache顶级项目。

2010年9月,Hive脱离Hadoop,成为Apache顶级项目。

2010年9月,Pig脱离Hadoop,成为Apache顶级项目。

2010年-2011年,扩大的Hadoop社区忙于建立大量的新组件(Crunch,Sqoop,Flume,Oozie等)来扩展Hadoop的使用场景和可用性。

2011年1月,ZooKeeper 脱离Hadoop,成为Apache顶级项目。

2011年12月,Hadoop1.0.0版本发布,标志着Hadoop已经初具生产规模。

2012年5月,Hadoop 2.0.0-alpha版本发布,这是Hadoop-2.x系列中第一个(alpha)版本。与之前的Hadoop-1.x系列相比,Hadoop-2.x版本中加入了YARN,YARN成为了Hadoop的子项目。

2012年10月,Impala加入Hadoop生态圈。

2013年10月,Hadoop2.0.0版本发布,标志着Hadoop正式进入MapReduce v2.0时代。

2014年2月,Spark开始代替MapReduce成为Hadoop的默认执行引擎,并成为Apache顶级项目。

2017年12月,继Hadoop3.0.0的四个Alpha版本和一个Beta版本后,第一个可用的Hadoop 3.0.0版本发布。

一套精通Hadoop的大数据必看教程

相关文章

  • Hadoop的前世今生

    随着数据的快速增长,数据的存储和分析都变的越来越困难。例如存储容量、读写速度、计算效率等都无法满足用户的需求。为了...

  • Hadoop 初识

    Hadoop的前世今生 Google大数据技术 MapReduce BigTable GFS 革命性的变化: 成本...

  • 写给老板们看的Hadoop入门指南

    Hadoop的前世今生大数据的使用场景大数据的组件概述大数据平台架构介绍

  • 将军在上之男昭女惜重生三世千年孽缘

    前世!今生!来世再续! 前世欠谁!今生还!来世再续前缘! 前世因!今生续!来世果!

  • 10.spark sql之快速入门

    前世今生 Hive&Shark   随着大数据时代的来临,Hadoop风靡一时。为了使熟悉RDBMS但又不理解Ma...

  • 人死,并非如灯灭……

    “今生,是前世的“来生”,是来生的“前世”。在今生中,我们能见到自己的前世与来生。回溯前世,是为了改善今生;回到今...

  • 【Hadoop系列】HDFS

    Hadoop的前世今生 什么是大数据 各行各业都会产生大量的数据,比如社交网站的意见观点,电商平台人们浏览网页停留...

  • 前世今生来世缘

    谈何前世情 今生还 今生情 来世还 前世孽债 前世还 未了 今生还 今生欠 今生还 谈何来世还 来世欠 来世还 能...

  • ClickHouse原理解析与应用实践

    第1章 ClickHouse的前世今生 在大量数据分析场景的解决方案中,传统关系型数据库很快就被Hadoop生态所...

  • iOS Device ID 的前世今生

    iOS Device ID 的前世今生 iOS Device ID 的前世今生

网友评论

    本文标题:Hadoop的前世今生

    本文链接:https://www.haomeiwen.com/subject/atmksltx.html