一、能力要求

Hadoop方向

Spark Sql部分

Spark Sql部分2

Spark Sql 部分3

Scala语言的选择

环境参数

二、环境使用

2.1 环境的目录结构

~/software :所有课程相关的软件；
~/app：软件的安装目录
~/data:所有的测试数据
~/source：源码（Spark需要重新编码的）
~/shell：课程里使用的一些脚本

2.2 配置映射关系：

Hadoop001这台机器对应这个ip地址

三、启动各个软件

启动hadoop:

[hadoop@hadoop001 app]$ cd ~/app/hadoop-2.6.0-cdh5.7.0/sbin,执行./start-dfs.sh 跟./start-yarn.sh来分别启动hdfs跟yarn

启动Hive:

[hadoop@hadoop001 hive-1.1.0-cdh5.7.0]$ cd ~/app/hive-1.1.0-cdh5.7.0/bin,然后执行./hive来启动hive

启动spark shell

启动spark shell

三、Hive

什么是Hive

为什么用Hive

Hiva的体系架构

部署架构

数据处理基石：Pandas数据探索
Pandas数据初探索本文介绍的是Pandas数据初探索。当我们生成或者导入了数据之后，通过数据的探索工作能够快...
Kotlin初探（二）数据加载
内容 Part 1:Kotlin初探（一）基础构建 Part2:Kotlin初探（二）数据加载 UI界面就是一个简...
数据初探
谈起人工智能，大家往往容易被神秘的“智能”一词迷惑，认为机器产生智能一定极其复杂深奥。诚然，人工智能确实是基于非常...
1.5-数据库认识加强
1.需求前后数据库变化 2.索引和离线数据 3.优化和大数据初探
一、初探大数据
一、能力要求二、环境使用 2.1 环境的目录结构 ~/software :所有课程相关的软件； ~/app：软件...
医学生物信息学：基因芯片数据挖掘分析表达差异基因
基因芯片数据挖掘分析表达差异基因基因芯片数据分析（一）：芯片数据初探基因芯片数据分析（二）：读取芯片数据基因...
2018年毕业论文指导参考题目
大数据背景下情报信息可视化初探大数据背景下身份识别方法初探公安情报部门企业维稳风险评估新形势下公安情报部门职...
一文了解Zookeeper的Watcher机制
Zookeeper系列介绍（持续更新） Zookeeper基础初探一文了解Zookeeper数据节点-znode...
Zookeeper实现分布式锁
Zookeeper系列介绍（持续更新） Zookeeper基础初探一文了解Zookeeper数据节点-znode...
一文了解Zookeeper数据节点-znode
Zookeeper系列介绍（持续更新） Zookeeper基础初探一文了解Zookeeper数据节点-znode...