Hadoop作为大数据的主流技术框架,至今仍然在大数据技术圈占有重要的地位,大数据学习基本上也离不开Hadoop,从Hadoop开始,学习核心组件,逐步扩展到生态圈其他组件,这是比较建议的学习路线。今天我们就来讲讲大数据学习Hadoop入门书单。
Hadoop、Spark、MapReduce、NoSQL、离线计算、实时计算、实时推送等等这些专业名词,背后都是技术框架组件在提供技术支持。
Hadoop大数据学习书单:
1、Hadoop权威指南:大数据的存储与分析(第4版)
作者:Tom White著王海,华东,刘喻,吕粤海译
这本书作为Hadoop最全面的入门书,结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。内容包括:
Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。
MapReduce组件,MapReduce应用开发、MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。
Hadoop运维,构建Hadoop集群、管理Hadoop。
Hadoop相关开源项目,Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。
2、深度剖析Hadoop HDFS
作者:林意群
这本书着重在Hadoop的分布式文件系统HDFS上,基于Hadoop 2.7.1版本进行分析,全面描述了HDFS 2.X的核心技术与解决方案。内容包括:
核心设计,HDFS的数据存储原理、HDFS的数据管理与策略选择机制、HDFS的新颖功能特性。
细节实现,HDFS的块处理、流量处理等细节,以及部分结构分析。
解决方案,HDFS的数据管理、HDFS的数据读写、HDFS的异常场景等。
3、HBase不睡觉书
作者:杨曦
Hbase在Hadoop生态当中,地位同样不可小觑。这本书对于Hbase作为非常详解的讲解,适合于零基础入门,并且希望深入掌握的大数据学习者。内容包括:
HBase概念、安装、配置、部署,让读者对HBase先有一个感性认识,再从应用角度介绍了高级用法、监控和性能调优。既兼顾了初学者,也适用于想要深入学习HBase的读者。
4、Hive实战
作者:[美]斯科特·肖(Scott Shaw)、[南非]安德烈亚斯·弗朗索瓦·弗穆
Hive在Hadoop生态当中,常常被定义为数据仓库工具,简单且容易上手,是深入学习Hadoop技术的一个很好的切入点。内容包括:
Hive的安装和配置,其核心组件和架构,Hive数据操作语言,如何加载、查询和分析数据,Hive的性能调优以及安全性等等。
关于大数据学习,Hadoop入门学习书单,以上就为大家做了详细的介绍了。大数据学习路漫漫,Hadoop生态是核心知识点,以上书单建议大家作为入门首选。
网友评论