美文网首页
大数据学习:Hadoop入门学习书单

大数据学习:Hadoop入门学习书单

作者: 成都加米谷大数据 | 来源:发表于2020-11-17 17:03 被阅读0次

    Hadoop作为大数据的主流技术框架,至今仍然在大数据技术圈占有重要的地位,大数据学习基本上也离不开Hadoop,从Hadoop开始,学习核心组件,逐步扩展到生态圈其他组件,这是比较建议的学习路线。今天我们就来讲讲大数据学习Hadoop入门书单。

    Hadoop、Spark、MapReduce、NoSQL、离线计算、实时计算、实时推送等等这些专业名词,背后都是技术框架组件在提供技术支持。

    Hadoop大数据学习书单:

    1、Hadoop权威指南:大数据的存储与分析(第4版)

    作者:Tom White著王海,华东,刘喻,吕粤海译

    这本书作为Hadoop最全面的入门书,结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。内容包括:

    Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。

    MapReduce组件,MapReduce应用开发、MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。

    Hadoop运维,构建Hadoop集群、管理Hadoop。

    Hadoop相关开源项目,Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。

    2、深度剖析Hadoop HDFS

    作者:林意群

    这本书着重在Hadoop的分布式文件系统HDFS上,基于Hadoop 2.7.1版本进行分析,全面描述了HDFS 2.X的核心技术与解决方案。内容包括:

    核心设计,HDFS的数据存储原理、HDFS的数据管理与策略选择机制、HDFS的新颖功能特性。

    细节实现,HDFS的块处理、流量处理等细节,以及部分结构分析。

    解决方案,HDFS的数据管理、HDFS的数据读写、HDFS的异常场景等。

    3、HBase不睡觉书

    作者:杨曦

    Hbase在Hadoop生态当中,地位同样不可小觑。这本书对于Hbase作为非常详解的讲解,适合于零基础入门,并且希望深入掌握的大数据学习者。内容包括:

    HBase概念、安装、配置、部署,让读者对HBase先有一个感性认识,再从应用角度介绍了高级用法、监控和性能调优。既兼顾了初学者,也适用于想要深入学习HBase的读者。

    4、Hive实战

    作者:[美]斯科特·肖(Scott Shaw)、[南非]安德烈亚斯·弗朗索瓦·弗穆

    Hive在Hadoop生态当中,常常被定义为数据仓库工具,简单且容易上手,是深入学习Hadoop技术的一个很好的切入点。内容包括:

    Hive的安装和配置,其核心组件和架构,Hive数据操作语言,如何加载、查询和分析数据,Hive的性能调优以及安全性等等。

    关于大数据学习,Hadoop入门学习书单,以上就为大家做了详细的介绍了。大数据学习路漫漫,Hadoop生态是核心知识点,以上书单建议大家作为入门首选。

    相关文章

      网友评论

          本文标题:大数据学习:Hadoop入门学习书单

          本文链接:https://www.haomeiwen.com/subject/buxfiktx.html