Spark与Hadoop关联

Spark与Hadoop关联

作者: 0_oHuanyu | 来源:发表于2017-09-11 21:03 被阅读41次

Spark与Hadoop关联
数据挖掘之Spark学习
[转]Spark购物篮分析:关联规则挖掘
2020-10-21
手工部署Hadoop与Spark
每天一句话-spark 自定义Hadoop/Hive配置
大数据之Spark
面试题：Spark相关一
使用Docker安装Hadoop和spark
spark yarn集群搭建（一：准备工作）

这种配环境的东西配过一次就忘了，还是记录一下吧。
spark运行需要jdk，scala，hadoop。
Hadoop是从cloudera官网下的cloudera manager虚拟机；
jdk版本为1.8；
scala版本为2.11。

cloudera manager（以下简称CM）官网虚拟机下载页链接：https://www.cloudera.com/downloads/quickstart_vms/5-12.html
spark官网下载页链接：https://spark.apache.org/downloads.html
scala官网下载页链接：http://www.scala-lang.org/download/

下载与解压
jdk下载要根据虚拟机是x86 还是x64选择，否则安不上。uname -a 可以查看当前os的版本。
注意scala是要下载linux系统的版本哦，别在windows中下载传到虚拟机中才发现下错了。。。
CM的下载也是需要选择虚拟机类型的，有vmware，virtualBox什么的。
spark下载好之后，tar -zxvf 解压安装，简单不用说。
修改配置文件
到spark解压的目录下，有个conf文件夹，里面放置了spark的配置文件。
先修改这个：spark-env.sh，加入以下变量：
HADOOP_CONF_DIR=/etc/hadoop/conf #这个是Hadoop的配置文件目录
SPARK_MASTER_HOST=quickstart.cloudera #spark master的主机名
SPARK_MASTER_WEBUI_PORT=8080 #查看master任务的web页面端口
SPARK_MASTER_PORT=7077 #master的通信端口
SPARK_WORKER_CORES=1 #worker核数
SPARK_WORKER_MEMORY=2g #worker内存占用
SPARK_WORKER_PORT=7078 #worker通信端口
SPARK_WORKER_WEBUI_PORT=8081 #查看worker任务的web页面端口
SPARK_WORKER_DIR=/home/cloudera/Downloads/temp #临时文件存放目录
再修改这个：slaves
这个不用解释了吧，输入worker主机名就好了
再修改最后一个：spark-defaults.conf
spark.master spark://quickstart.cloudera:7077 #设置spark任务提交的目标

完成~
在根目录输入bin/spark-shell 查看quickstart.cloudera:8080 ，如果application那一栏有东西就说明成功了。

相关文章

Spark与Hadoop关联
这种配环境的东西配过一次就忘了，还是记录一下吧。spark运行需要jdk，scala，hadoop。Hadoop是...
数据挖掘之Spark学习
阅读路线: Hadoop与Spark比较 Spark的安装 Spark知识点一、Hadoop与Spark比较简...
[转]Spark购物篮分析:关联规则挖掘
1、浅谈数据挖掘中的关联规则挖掘 2、Hadoop/MapReduce购物篮分析:关联规则挖掘 3、Spark购物...
2020-10-21
spark 入门课程目标：了解spark概念知道spark的特点（与hadoop对比）独立实现spark ...
手工部署Hadoop与Spark
Hadoop与Spark之间区别联系类似WPS与Word，即Hadoop与Spark功能相同，一个性能较高、另一个...
每天一句话-spark 自定义Hadoop/Hive配置
使用spark hadoop属性 spark.hadoop.，使用spark hive 属性时 spark.hiv...
大数据之Spark
1、Spark与Hadoop Hadoop 已经成了大数据技术的事实标准，Hadoop MapReduce 也非常...
面试题：Spark相关一
1 Spark与MR的区别？（5点）参考：Spark与Hadoop MR的异同使用场景：实时处理，spark...
使用Docker安装Hadoop和spark
使用docker配置安装hadoop和spark 分别安装hadoop和spark镜像安装hadoop镜像选择...
spark yarn集群搭建（一：准备工作）
linux环境准备 spark/hadoop安装包 spark-2.3.1-bin-hadoop2.7.tgzHa...

网友评论

本文标题：Spark与Hadoop关联

本文链接：https://www.haomeiwen.com/subject/jhzfsxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Spark与Hadoop关联|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！