想学大数据?先看完这几本书再说

作者: yoku酱 | 来源:发表于2019-01-22 16:48 被阅读9次

真正的数据爱好者有很多需要阅读的内容:大数据,机器学习,数据科学,数据挖掘等。除了这些技术领域,还有一些特定的技术和语言需要你继续研究:Hadoop,Spark,Python,和R等等,还有无数实现自动化的工具等等,这些工具几乎每天都会用到,这就需要你不断的学习。幸运的是,以上提到的这些都不缺关于它们的书籍。

本文首先帮大家盘点几本大数据相关的书籍,这些书都是亚马逊上的畅销排行榜上的:

关于大数据

1、《Big Data》

在大数据的背景下,我很少看到关于数据建模,数据层,数据处理需求分析以及数据架构和存储实现问题。这本书却提供了令人耳目一新的全面解决方案。

但不可忽略的是,它也引入了大多数开发者并不熟悉的、困扰传统架构的复杂性问题。本书将教你充分利用集群硬件优势的Lambda架构,以及专门用来捕获和分析网络规模数据的新工具,来创建这些系统。

对大数据的概念都是模糊不清的,大数据是什么,能做什么,学的时候,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入大数据学习qq群:458345782,有大量干货(零基础以及进阶的经典实战)分享给大家,并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实用学习流程体系 。

关于Apache Hadoop

2、《Hadoop: The Definitive Guide》

本书通过丰富的案例学习来解释Hadoop的幕后机理,阐述了Hadoop如何解决现实生活中的具体问题。第3版覆盖Hadoop的最新动态,包括新增的MapReduceAPI,以及MapReduce2及其灵活性更强的执行模型(YARN)。

关于Apache Spark

3、《Learning Spark》

《Spark 快速大数据分析》是一本为Spark 初学者准备的书,它没有过多深入实现细节,而是更多关注上层用户的具体用法。不过,本书绝不仅仅限于Spark 的用法,它对Spark 的核心概念和基本原理也有较为全面的介绍,让读者能够知其然且知其所以然。

关于数据挖掘

4、《数据挖掘》

本书是关于数据挖掘领域的综合概述,我认为这本书作为研究生的课程用书是最好的,或者作为参考书。本书前版曾被KDnuggets的读者评选为最受欢迎的数据挖掘专著,是一本可读性极佳的教材。

它从数据库角度全面系统地介绍数据挖掘的概念、方法和技术以及技术研究进展,并重点关注近年来该领域重要和最新的课题——数据仓库和数据立方体技术,流数据挖掘,社会化网络挖掘,空间、多媒体和其他复杂数据挖掘。

5、《Mining of Massive Datasets》

本书是在Anand Rajaraman和Jeff Ullman于斯坦福大学教授多年的一门季度课程的材料基础上总结而成的。简单来说,本书是关于数据挖掘的。但是,本书主要关注极大规模数据的挖掘,也就是说这些数据大到无法在内存中存放。

由于重点强调数据的规模,所以本书的例子大都来自Web本身或者Web上导出的数据。另外,本书从算法的角度来看待数据挖掘,即数据挖掘是将算法应用于数据,而不是使用数据来“训练”某种类型的机器学习引擎。

免费电子书

想从事数据科学,除了以上提及的那些书籍,还有很多这个领域的入门书籍,但是在你真正开始之前,你更应该对这个领域有一个广泛的了解。

下面我们还精选了5本免费的电子书,可以帮助你更好的理解数据科学的全部内容,以及为你后续学习数据科学、大数据和数据分析做好准备。

1、《Big Data: The Numbers Game Deciphered》

要想学习简明扼要的关于大数据世界的概述,可以阅读这本只有11页的电子书,这本书以数据科学领域的最新发展为背景,读完这本书,你将可以了解到:

● 成为数据科学家应该具备的学历

● 数据科学领域需要具备的技术/非技术类的技能

● 数据科学的学习资源

书籍下载地址:http://www.simplilearn.com/the-numbers-game-deciphered-guide-pdf

2、《Top Programming Languages for a Data Scientist》

编程是数据科学家绝对必须具备的核心技术技能。通过这本详细的指南,了解掌握哪些编程语言可以优先考虑入门数据科学。读完这本书,你可以了解到

● 数据科学职业的十大编程语言列表;

● 这些编程语言的特点;

● 如何将你掌握的技能应用于数据科学家。

书籍下载地址:http://www.simplilearn.com/top-programming-languages-for-data-scientist-guide-pdf

3、《8 Essential Concepts of Big Data and Hadoop》

Hadoop可以说是大数据家族中最重要的技术,称得上是大数据革命的核心。通过阅读这本便捷指南,可以了解你需要了解的关于Hadoop及其生态系统的所有信息。

书籍下载地址:http://www.simplilearn.com/big-data-and-hadoop-8-essential-concepts-guide-pdf

4、《Secret to Unlocking Tableau's Hidden Potential》

Tableau使分析变得简单易行,不仅适用于分析师,也适用于高层管理人员,IT专业人员以及其他所有人员。如果你正在寻找能够充分发挥Tableau功能的技巧,以及有用的黑客技巧,这本电子书将会告诉你需要了解的内容。

书籍地址:http://www.simplilearn.com/secret-to-unlocking-tableau-hidden-potential-guide-pdf

5、《Top 25 Interview Questions and Answers: Big Data Analysis》

即便你是一位很厉害的数据专家,在求职面试中,你依然需要绞尽脑汁让面试官对你印象深刻,否则你依然很难得到你一直梦寐以求的那个职位,这本书灰机了大数据面试最常问的问题和答案,相信可以助你一臂之力。

书籍下载地址:http://www.simplilearn.com/top-big-data-analysis-interview-questions-answers-guide-pdf

对大数据的概念都是模糊不清的,大数据是什么,能做什么,学的时候,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入大数据学习qq群:458345782,有大量干货(零基础以及进阶的经典实战)分享给大家,并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实用学习流程体系 。

相关文章

  • 想学大数据?先看完这几本书再说

    真正的数据爱好者有很多需要阅读的内容:大数据,机器学习,数据科学,数据挖掘等。除了这些技术领域,还有一些特定的技术...

  • 阅读成果VS阅读兴趣,哪个重要?

    “妈妈,我想买这本书!” “等你安静的能把这本书看完了再说!” ...

  • 5分钟搭建大数据学习环境

    想学大数据,先搭个环境再说,要准备多少台服务器,每台服务器的基础环境设置,各个服务器的网络互联,真是很麻烦的一...

  • 先搞懂这几点,再说理财

    1、为什么要学习理财? 我的奶奶,活了八十多岁,一辈子勤劳节俭,有一点结余就用手绢包好,藏到压箱底。年轻的时候,为...

  • 学习大数据为什么先学Java?

    学习大数据是否必须会java? 很多零基础学员想学大数据都知道,学大数据部分课程之前要先学习一种计算机编程语言。大...

  • 可转债学习有感

    这几天把可转债投资魔法书这本书看完,发现这本书的写作时间和引用数据都是2012年之前,所以难免有些不够现在...

  • 读《学习力》有感

    其实我也是看完这本书才开始写书评的,之前一直用思维导图做输出。很喜欢Angie强调的,啥也别想先做起来再说。于...

  • 失恋三十天倒计时15

    今天终于可以看怦然心动了,看完再说,看完再说~

  • 我对数据中台的理解

    这几天在看一本介绍数据中台的书,今天花了两个小时看完了这本书。当然我这次写的关于对数据中台的理解不是这本书的...

  • 【我在悦读0907】1402-空谷幽兰

    这几天一直在看《清单革命》,看之前对清单有模糊的了解,看这本书的目的是想学会制作和运用清单。 看完后,我有点蒙了,...

网友评论

    本文标题:想学大数据?先看完这几本书再说

    本文链接:https://www.haomeiwen.com/subject/fchrjqtx.html