架构
Elastic-Job是一个分布式调度解决方案,由两个相互独立的子项目Elastic-Job-Lite和Elastic-Job-Cloud组成。实际上我司在用的是Elatic-Job-Lite,所以本文只讨论Elastic-Job-Lite。Elastic-Job-Lite定位为轻量级无中心化解决方案,使用jar包的形式提供分布式任务的协调服务。
架构图
从上图左上角可知,Elastic-Job不是独立部署的,而是被业务系统依赖jar;用zookeeper作为分布式协调,Elatic-Job将作业、服务器、数据分片等等信息注册到zookeeper,并监控zookeeper数据,而运维平台console和Elastic-Job-Lite并无直接关系,console只是查询了zookeeper节点的数据状态,当然也能通过接口改变zookeeper的数据。
概述
elastic-job 主要的设计理念是无中心化的分布式定时调度框架,思路来源于 Quartz 的基于数据库的高可用方案。但数据库没有分布式协调功能,所以在高可用方案的基础上增加了弹性扩容和数据分片的思路,以便于更大限度的利用分布式服务器的资源。
由上可知,elastic-job并无统一调度中心,每个运行在集群中的作业服务器都是对等的,节点之间通过注册中心进行分布式协调。但 elastic-job 有主节点的概念,主节点用于处理一些集中式任务,如分片,清理运行时信息等,并无调度功能,定时调度都是由作业服务器自行触发;elastic-job的设计参考了Quaetz基于数据库的高可用性方案,所以elastic-job的核心功能其实和Quartz差不多,只是Quartz是基于数据库,而elastic-job是基于Zookeeper;elastic-job的数据分片是一大特性,可以更大限度的利用分布式服务器的资源。
代码目录结构
代码目录结构主要功能
a) 分布式:重写 Quartz 基于数据库的分布式功能,改用 Zookeeper 实现注册中心。
b) 并行调度:采用任务分片方式实现。将一个任务拆分为 n 个独立的任务项,由分布式的服务器并行执行各自分配到的分片项。
c) 弹性扩容缩容:将任务拆分为 n 个任务项后,各个服务器分别执行各自分配到的任务项。一旦有新的服务器加入集群,或现有服务器下线,elastic-job 将在保留本次任务执行不变的情况下,下次任务开始前触发任务重分片。
d) 集中管理:采用基于 Zookeeper 的注册中心,集中管理和协调分布式作业的状态,分配和监听。外部系统可直接根据 Zookeeper 的数据管理和监控 elastic-job。
e) 定制化流程型任务:作业可分为简单和数据流处理两种模式,数据流又分为高吞吐处理模式和顺序性处理模式,其中高吞吐处理模式可以开启足够多的线程快速的处理数据,而顺序性处理模式将每个分片项分配到一个独立线程,用于保证同一分片的顺序性,这点类似于 kafka 的分区顺序性。
以上d),外部系统可直接根据zookeeper的数据管理和监控elastic-job。这是因为elastic-job会把作业、服务器、分片信息等注册到zookeeper,Zookeeper目前的znode分四类,config,servers,execution,leader。config用于保存分布式作业的全局控制,如,分多少片,要不要执行misfire,cron表达式。servers用于注册作业服务器状态和分片信息。execution以分片的维度存储作业运行时状态。leader用于存储主节点。elastic-job作业执行是无中心化的,但主节点起到协调的作用,如:重分片、清理上次运行时信息等。运维平台console和elastic-job-lite并无直接关系,是通过读取作业注册中心数据展现作业状态,或更新注册中心数据修改全局配置;而可以通过运维平台操作作业触发、暂停、下线、恢复,则是利用了zookeeper的监控watch特性,elastic-job-lite会监听zookeeper的状态,然后再调用Quartz的接口实现的。
网友评论