课程大纲:
01.开班典礼
02.hadoop-hdfs 存储、架构模型、角色、持久化
03.hadoop-hdfs 读写流程、配置、完全分布式&CLI命令
04.hadoop-hdfs api开发 HA集群搭建
05.hadoop-MR YARN架构理论与集群搭建、WordCount
06.hadoop-MR 开发&源码分析
07.hadoop-MR MapTask、MapTask、ReduceTask源码分析
08.MR源码分析:Mapask输出分析、Reduceask输入分析
09.MR源码分析Reduceask输出分析及MR天气案例
10.hadoop-MR开发案例:好友推荐案例及pagerank案例
11.hadoop-MR开发案例:tfidf案例及itemcf案例
12.Hive介绍以及安装
13.Hive实战
14.HBase介绍以及安装
15.HBase调优
16.Hadoop项目需求分析
17.Hadoop项目准备
18.Hadoop项目数据采集以及清洗
19.Hadoop项目代码实现以及优化
20.Hadoop项目架构扩展以及组件整合
21.storm理论-Storm介绍以及代码实战
22.storm理论-Storm伪分布式搭建以及任务部署
23.storm理论-Storm架构详解以及DRCP原理
24.redis理论-redis类型
25.redis理论-redis高级
26.Scala语法—Scala语法介绍
27.Scala语法—scala语法实战
28.Spark理论—介绍
29.Spark介绍、RDD的五大特性
30.RDD算子的讲解
31.RDD控制类算子以及集群搭建
32.SparkPi 计算圆周率的原理高可用集群的搭建
33.任务调度流程01
34.任务调度流程02
35.任务调度流程03
36.资源调度流程
37.多种提交Application的方式以及 SparkShuffle
38.SparkShuffle
39.案例
40.广播变量、累加器
41.重分区算子
42.SparkSQL介绍
43.SparkSQL处理parquet json数据
44.SparkSQL自定义函数 Spark on hive整合步骤
45.配置thrift server 安全机制 以及小区掉话率的统计案例
46.Spark调优(资源,并行度)
47.Spark调优(数据本地化调优)
48.Spark解决数据倾斜的方案、SparkStreaming介绍
49.SparkStreaming案例
50.SparkStreaming on kafka
51.机器学习项目-推荐系统介绍以及架构分析
52.机器学习项目-推荐系统的特征工程
53.机器学习项目-推荐系统代码实现以及部署
54.Elasticsearch理论-Elasticsearch搜索原理
55.Elasticsearch理论-Elasticsearch实战
56.大数据面试培训(一)
57.大数据面试培训(二)
58.机器学习
59.ElasticSearch
60.机器学习
网友评论