我们使用开发语言scala编写Spark计算
scala的安装:
下载 scala-2.11.8.tgz
解压并配置环境变量。
命令行运行 scala

Spark环境安装
因为我们使用的Hadoop cdh 版本 所以我们要对官网下载的Spark环境进行一个编译打包 因为官网并未提供cdh版本
具体编译的链接如下:
https://www.cnblogs.com/tnsay/p/7662019.html
编译好的文件也可以在csdn搜索 spark-2.1.0-bin-2.6.0-cdh5.7.0.tgz 并下载
解压 并且进入bin
下面是运行命令 以及 Spark wordCount函数


因为我们采用的是 local 方式所以我们可以进入本地WebUI 控制台查看操作计算日志:

网友评论