大数据相关技术学习和使用了一段时间,最近就没有怎么用了。打算把之前学习的知识总结并记录起来分享给大家,防止忘记了,那就浪费了花费的那么时间和精力了。本系列全部采用hadoop2.5.2的版本,下面大概介绍一下打算写的内容大纲:
如何安装和搭建虚拟机网络
hadoop2.5.2的伪分布式搭建
hadoop2.5.2+centos6.5编译源码
HDFS的讲解
Hadoop 2.5.2分布式环境部署
Zookeeper分布式集群部署
Hadoop 2.x高可用性部署
MapReduce详解1
MapReduce详解2
hive的功能介绍,安装和测试
hive 中UDF编程
Hive 表的创建、数据加载、导出、查询
Hive日志分析
Sqoop 导入导出数据
Flume实时抽取监控目录数据
大数据可视化工具Hue安装使用
Oozie工作流的安装及使用
Spark 功能、编译及安装部署测试
Spark SQL
Spark streaming
Hbase集群部署及测试
网友评论