Hadoop的最核心的存储层叫做HDFS,全称是Hadoop文件存储系统,有了存储系统还要有分析系统,于是就有了开源版本的MapReduce,类似的参照BigTable就有了Hbase。一开源之后整个系统用的人就多了,于是大家都像要各种各样的特性facebook的那些人觉得mapreduce程序太难写,于是就开发了Hive,Hive就是一套能把SQL语句转成Mapreduce的工具,有了这套工具只要你会 SQL就可以来Hadoop上写mapreduce程序分析数据了。
技术书推荐:
1、驾驭大数据

推荐理由:

2、Hadoop技术详解

推荐理由:

3、MapReduce设计模式

推荐理由:
“虽然MapReduce编程模型看似简单,但用来高效地解决实际问题还需要不同的思维方式。本书清晰地传达了只有经过多年实践积累才能获得的相关经验。”
4、Hadoop MapReduce性能优化

推荐理由:
汇聚社区经验精华,阐述配置Hadoop集群运行最优MapReduce作业的方法
5、HBase实战

推荐理由:
大数据技术迅猛发展,以HadOOP、HBase为代表的一批大数据通用技术和开源项目展现出了强大的生命力,也引起了各方人士的广泛关注。作为NoSQL数据库的杰出代表,HBase正在FaceBook、Twitter、新浪、淘宝等企业的核心系统中发挥重要作用。《HBase实战》一书的出版正当其时,书中所介绍的先进技术理念和实战指南,能够帮助企业用户搭建自己的大数据平台,开启大数据时代的探索之旅。
6、Hive编程指南

推荐理由:

7、Pig编程指南

推荐理由:
Apache Pig 是一个高级过程语言,适合于使用 Hadoop 和 MapReduce 平台来查询大型半结构化数据集。通过允许对分布式数据集进行类似 SQL 的查询,Pig 可以简化 Hadoop 的使用。本文不仅为初学者讲授,Pig 的基础知识,同时还向有经验的用户更加全面的介绍Pig的重点特性。 通过学习本书,你将能够身日了解数据模型,包括基本数据和复杂数据类型。掌握更高效的在Hadoop集群中运行脚本的方法和技巧。
8、HBase权威指南

推荐理由:
“分布式系统充其量只能说是经常‘多云’的。Lars George从那些主题的‘水蒸气’中提炼出了实际的项目,在此过程中,他为我们呈现了一本卓越的HBase指南。”
网友评论