Spark HA的实现

作者: Movle | 来源:发表于2020-05-17 18:29 被阅读0次

Spark | HA
Spark HA的实现
spark HA集群安装
《从0到1学习spark》-- spark初体验
010 Spark Stream 案例2：单词统计例子
谷歌云数据工程师考试 - Data Proc 复习笔记
spark题01
spark streaming + flume+python(编
spark初识篇
Spark master HA

分布式的HA

1.基于文件系统的单点恢复(注意：不能用于生产，主要用于开发和测试)

主要用于开发或测试环境。当spark提供目录保存spark Application和worker的注册信息，并将他们的恢复状态写入该目录中，这时，一旦Master发生故障，就可以通过重新启动Master进程(sbin/start-master.sh)，恢复已运行的spark Application和worker的注册信息。

基于文件系统的单点恢复，主要是在spark-env.sh里对SPARK_DAEMON_JAVA_OPTS设置

配置参数	参考值
spark.deploy.recoveryMode	设置为FILESYSTEM开启单点恢复功能，默认值：NONE
spark.deploy.recoveryDirectory	Spark 保存恢复状态的目录

(1)在spark-env.sh中添加

export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=FILESYSTEM -Dspark.deploy.recoveryDirectory=/opt/module/spark-2.1.0-bin-hadoop2.7/recovery"

(2)测试：
a.在hadoop1上启动Spark集群
b.在hadoop2上启动spark shell

MASTER=spark://hadoop1:7077 spark-shell

c.在hadoop1上停止master

stop-master.sh

d.观察hadoop2上的输出:

e.在hadoop1上重启master

start-master.sh

2.基于Zookeeper的Standby Masters

ZooKeeper提供了一个Leader Election机制，利用这个机制可以保证虽然集群存在多个Master，但是只有一个是Active的，其他的都是Standby。当Active的Master出现故障时，另外的一个Standby Master会被选举出来。由于集群的信息，包括Worker， Driver和Application的信息都已经持久化到ZooKeeper，因此在切换的过程中只会影响新Job的提交，对于正在进行的Job没有任何的影响。加入ZooKeeper的集群整体架构如下图所示。

配置参数	参考值
spark.deploy.recoveryMode	设置为ZOOKEEPER开启单点恢复功能，默认值：NONE
spark.deploy.zookeeper.url	ZooKeeper集群的地址
spark.deploy.zookeeper.dir	Spark信息在ZK中的保存目录，默认：/spark

(1)做法：
(a)在每个节点中的spark-env.sh文件中添加以下代码：

export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=hadoop1:2181,hadoop2:2181,hadoop3:2181 -Dspark.deploy.zookeeper.dir=/spark"

(b)另外：每个节点上，需要将以下两行注释掉。

# export SPARK_MASTER_HOST=hadoop1
# export SPARK_MASTER_PORT=7077

(c)start-all启动spark集群
从任意Worker节点，再启动一个Master

(d)ZooKeeper中保存的信息

网友评论

本文标题：Spark HA的实现

本文链接：https://www.haomeiwen.com/subject/xdwsohtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Spark HA的实现

1.基于文件系统的单点恢复(注意：不能用于生产，主要用于开发和测试)

2.基于Zookeeper的Standby Masters

相关文章

Spark | HA