大数据学习线路

大数据学习线路

作者: Steven_cao | 来源:发表于2019-02-22 23:13 被阅读2次

[ITSTAR]第一讲：大数据基础入门
大数据学习线路
大数据学习线路
大数据学习线路图
零基础学习大数据：大数据学习线路
学习线路
数据库学习线路图
自学大数据：大数据学习线路及各阶段学习书籍
Swift 学习笔记
计算机网络基础-数据链路层

本文转自程序媛小雪文章 java转大数据的学习路线

第一阶段（基础阶段）

1）Linux学习（跟鸟哥学就ok了）—–20小时

Linux操作系统介绍与安装。
Linux常用命令。
Linux常用软件安装。
Linux网络。
防火墙。
Shell编程等。

官网：https://www.centos.org/download/
中文社区：http://www.linuxidc.com/Linux/2017-09/146919.htm

2）Java 高级学习（[《深入理解Java虚拟机》]、[《Java高并发实战》]）—30小时

掌握多线程。
掌握并发包下的队列。
了解JMS。
掌握JVM技术。
掌握反射和动态代理。

官网：https://www.java.com/zh_CN/
中文社区：http://www.java-cn.com/index.html

3）Zookeeper学习（可以参照这篇博客进行学习：http://www.cnblogs.com/wuxl360/p/5817471.html）

Zookeeper分布式协调服务介绍。
Zookeeper集群的安装部署。
Zookeeper数据结构、命令。
Zookeeper的原理以及选举机制。

官网：http://zookeeper.apache.org/
中文社区：http://www.aboutyun.com/forum-149-1.html

第二阶段（攻坚阶段）

4）Hadoop （《Hadoop 权威指南》）—80小时

HDFS
- HDFS的概念和特性。
- HDFS的shell操作。
- HDFS的工作机制。
- HDFS的Java应用开发。
MapReduce
- 运行WordCount示例程序。
- 了解MapReduce内部的运行机制。
  - MapReduce程序运行流程解析。
  - MapTask并发数的决定机制。
  - MapReduce中的combiner组件应用。
  - MapReduce中的序列化框架及应用。
  - MapReduce中的排序。
  - MapReduce中的自定义分区实现。
  - MapReduce的shuffle机制。
  - MapReduce利用数据压缩进行优化。
  - MapReduce程序与YARN之间的关系。
  - MapReduce参数优化。
MapReduce的Java应用开发

官网：http://hadoop.apache.org/
中文文档：http://hadoop.apache.org/docs/r1.0.4/cn/
中文社区：http://www.aboutyun.com/forum-143-1.html

5）Hive（《Hive开发指南》）–20小时

Hive 基本概念
- Hive 应用场景。
- Hive 与hadoop的关系。
- Hive 与传统数据库对比。
- Hive 的数据存储机制。
Hive 基本操作
- Hive 中的DDL操作。
- 在Hive 中如何实现高效的JOIN查询。
- Hive 的内置函数应用。
- Hive shell的高级使用方式。
- Hive 常用参数配置。
- Hive 自定义函数和Transform的使用技巧。
- Hive UDF/UDAF开发实例。
Hive 执行过程分析及优化策略

官网：https://hive.apache.org/
中文入门文档：http://www.aboutyun.com/thread-11873-1-1.html
中文社区：http://www.aboutyun.com/thread-7598-1-1.html

6）HBase（《HBase权威指南》）—20小时

hbase简介。
habse安装。
hbase数据模型。
hbase命令。
hbase开发。
hbase原理。

官网：http://hbase.apache.org/
中文文档：http://abloz.com/hbase/book.html
中文社区：http://www.aboutyun.com/forum-142-1.html

7）Scala（《快学Scala》）–20小时

Scala概述。
Scala编译器安装。
Scala基础。
数组、映射、元组、集合。
类、对象、继承、特质。
模式匹配和样例类。
了解Scala Actor并发编程。
理解Akka。
理解Scala高阶函数。
理解Scala隐式转换。

官网：http://www.scala-lang.org/
初级中文教程：http://www.runoob.com/scala/scala-tutorial.html

8）Spark （《Spark 权威指南》）—60小时

enter image description here

Spark core
- Spark概述。
- Spark集群安装。
- 执行第一个Spark案例程序（求PI）。
RDD
enter image description here
- RDD概述。
- 创建RDD。
- RDD编程API（Transformation 和 Action Operations）。
- RDD的依赖关系
- RDD的缓存
- DAG（有向无环图）
Spark SQL and DataFrame/DataSet
enter image description here
- Spark SQL概述。
- DataFrames。
- DataFrame常用操作。
- 编写Spark SQL查询程序。
Spark Streaming
enter image description here enter image description here
- park Streaming概述。
- 理解DStream。
- DStream相关操作（Transformations 和 Output Operations）。
Structured Streaming
其他（MLlib and GraphX ）

这个部分一般工作中如果不是数据挖掘，机器学习一般用不到，可以等到需要用到的时候再深入学习。

官网：http://spark.apache.org
中文文档（但是版本有点老）：https://www.gitbook.com/book/aiyanbo/spark-programming-guide-zh-cn/details
中文社区：http://www.aboutyun.com/forum-146-1.html

9）Python (推荐廖雪峰的博客—30小时

10）自己用虚拟机搭建一个集群，把所有工具都装上，自己开发一个小demo —30小时

相关文章

[ITSTAR]第一讲：大数据基础入门
大数据本质： HDFS与MapReduce编程：大数据学习线路：详情：
大数据学习线路
总结了一些大数据的学习线路，不是很全面，有不足的地方希望简友们能指正。一、学习课程 java(Java se,j...
大数据学习线路
本文转自程序媛小雪文章 java转大数据的学习路线第一阶段（基础阶段） 1）Linux学习（跟鸟哥学就ok了...
大数据学习线路图
Java教程 Java 教程Java 简介Java 开发环境配置Java 基础语法Java 对象和类Java 基本...
零基础学习大数据：大数据学习线路
其实简单的来说，大数据就是通过分析和挖掘全量的非抽样的数据辅助决策。大数据可以实现的应用可以概括为两个方向，一个...
学习线路
一、打好基础才能百战不殆参考学习顺序-知乎二、Java基础《Java核心技术卷1》链接：云盘链接提取...
数据库学习线路图
SQL 语法教程 SQL 教程SQL 简介SQL 语法SQL Select选择SQL SELECT DISTINC...
自学大数据：大数据学习线路及各阶段学习书籍
大数据学习路线及各阶段学习书籍推荐！阶段一、大数据基础——java语言基础方面（1）Java语言基础 Java...
Swift 学习笔记
大纲学习线路主要分为UIKit、Foundation、网络请求三大路线；结合文档梳理笔记，github托管代码...
计算机网络基础-数据链路层
数据链路层概念链路节点到节点的物理线路，中间没得任何节点数据链路物理线路只是用来传输数据，还需要一定的协议保证...

网友评论

本文标题：大数据学习线路

本文链接：https://www.haomeiwen.com/subject/sqoyyqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|大数据学习线路|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！