美文网首页技术郭志敏的程序员书屋PMbook
大数据时代必读的几本技术书

大数据时代必读的几本技术书

作者: 54b59ee78c42 | 来源:发表于2015-01-30 10:38 被阅读3799次

    Hadoop的最核心的存储层叫做HDFS,全称是Hadoop文件存储系统,有了存储系统还要有分析系统,于是就有了开源版本的MapReduce,类似的参照BigTable就有了Hbase。一开源之后整个系统用的人就多了,于是大家都像要各种各样的特性facebook的那些人觉得mapreduce程序太难写,于是就开发了Hive,Hive就是一套能把SQL语句转成Mapreduce的工具,有了这套工具只要你会 SQL就可以来Hadoop上写mapreduce程序分析数据了。

    技术书推荐:

    1、驾驭大数据

    推荐理由:

    2、Hadoop技术详解

    推荐理由:

    3、MapReduce设计模式

    推荐理由:
    “虽然MapReduce编程模型看似简单,但用来高效地解决实际问题还需要不同的思维方式。本书清晰地传达了只有经过多年实践积累才能获得的相关经验。”

    4、Hadoop MapReduce性能优化

    推荐理由:
    汇聚社区经验精华,阐述配置Hadoop集群运行最优MapReduce作业的方法

    5、HBase实战

    推荐理由:
    大数据技术迅猛发展,以HadOOP、HBase为代表的一批大数据通用技术和开源项目展现出了强大的生命力,也引起了各方人士的广泛关注。作为NoSQL数据库的杰出代表,HBase正在FaceBook、Twitter、新浪、淘宝等企业的核心系统中发挥重要作用。《HBase实战》一书的出版正当其时,书中所介绍的先进技术理念和实战指南,能够帮助企业用户搭建自己的大数据平台,开启大数据时代的探索之旅。

    6、Hive编程指南

    推荐理由:

    7、Pig编程指南

    推荐理由:
    Apache Pig 是一个高级过程语言,适合于使用 Hadoop 和 MapReduce 平台来查询大型半结构化数据集。通过允许对分布式数据集进行类似 SQL 的查询,Pig 可以简化 Hadoop 的使用。本文不仅为初学者讲授,Pig 的基础知识,同时还向有经验的用户更加全面的介绍Pig的重点特性。 通过学习本书,你将能够身日了解数据模型,包括基本数据和复杂数据类型。掌握更高效的在Hadoop集群中运行脚本的方法和技巧。

    8、HBase权威指南


    推荐理由:

    “分布式系统充其量只能说是经常‘多云’的。Lars George从那些主题的‘水蒸气’中提炼出了实际的项目,在此过程中,他为我们呈现了一本卓越的HBase指南。”

    相关文章

      网友评论

        本文标题:大数据时代必读的几本技术书

        本文链接:https://www.haomeiwen.com/subject/cmelxttx.html