使用docker-compose创建spark集群

作者: kongxx | 来源:发表于2018-07-05 08:45 被阅读57次

使用docker-compose创建spark集群
docker-compose安装consul集群
使用docker搭建spark(2.3.1)集群
SparkContext源码剖析(version 2.3.1)
aws spark集群web功能
Docker Compose如何与SkyEye完美结合
搭建Spark的单机版集群
pyspark RDD笔记
使用docker-compose创建hadoop集群
使用docker 搭建 zookeeper 集群

下载docker镜像

sudo docker pull sequenceiq/spark:1.6.0

创建docker-compose.yml文件

创建一个目录，比如就叫 docker-spark，然后在其下创建docker-compose.yml文件，内容如下：

version: '2'

services:
  master:
    image: sequenceiq/spark:1.6.0
    hostname: master
    ports:
      - "4040:4040"
      - "8042:8042"
      - "7077:7077"
      - "8088:8088"
      - "8080:8080"
    restart: always
    command: bash /usr/local/spark/sbin/start-master.sh && ping localhost > /dev/null

  worker:
    image: sequenceiq/spark:1.6.0
    depends_on:
      - master
    expose:
      - "8081"
    restart: always
    command: bash /usr/local/spark/sbin/start-slave.sh spark://master:7077 && ping localhost >/dev/null

其中包括一个master服务和一个worker服务。

创建并启动spark集群

sudo docker-compose up

集群启动后，我们可以查看一下集群状态

sudo docker-compose ps
        Name                      Command               State                                                    Ports
----------------------------------------------------------------------
dockerspark_master_1   /etc/bootstrap.sh bash /us ...   Up      ...
dockerspark_worker_1   /etc/bootstrap.sh bash /us ...   Up      ...

默认我们创建的集群包括一个master节点和一个worker节点。我们可以通过下面的命令扩容或缩容集群。

sudo docker-compose scale worker=2

扩容后再次查看集群状态，此时集群变成了一个master节点和两个worker节点。

sudo docker-compose ps
        Name                      Command               State                                                    Ports
------------------------------------------------------------------------
dockerspark_master_1   /etc/bootstrap.sh bash /us ...   Up      ...
dockerspark_worker_1   /etc/bootstrap.sh bash /us ...   Up      ...
dockerspark_worker_2   /etc/bootstrap.sh bash /us ...   Up      ...

此时也可以通过浏览器访问 http://ip:8080 来查看spark集群的状态。

运行spark作业

首先登录到spark集群的master节点

sudo docker exec -it <container_name> /bin/bash

然后使用spark-submit命令来提交作业

/usr/local/spark/bin/spark-submit --master spark://master:7077 --class org.apache.spark.examples.SparkPi /usr/local/spark/lib/spark-examples-1.6.0-hadoop2.6.0.jar 1000

停止spark集群

sudo docker-compose down

网友评论

本文标题：使用docker-compose创建spark集群

本文链接：https://www.haomeiwen.com/subject/xyeuuftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

使用docker-compose创建spark集群

下载docker镜像

创建docker-compose.yml文件

创建并启动spark集群

运行spark作业

停止spark集群

相关文章

使用docker-compose创建spark集群

docker-compose安装consul集群

使用docker搭建spark(2.3.1)集群

SparkContext源码剖析(version 2.3.1)

aws spark集群web功能

Docker Compose如何与SkyEye完美结合

搭建Spark的单机版集群

pyspark RDD笔记

使用docker-compose创建hadoop集群

使用docker 搭建 zookeeper 集群

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

Docker

大数据