分布式任务调度平台XXL-JOB搭建教程

作者: AKyS佐毅 | 来源:发表于2019-05-28 16:56 被阅读24次

分布式任务调度平台XXL-JOB
《分布式任务调度平台XXL-JOB》之初学入门记录
思考--xxl-job简单的记录
k3s 运行xxl-job 跑powershell脚本
SpringBoot入门建站全系列（三十二）接入xxl-job分
分布式任务调度平台 XXL-JOB
分布式任务调度平台XXL-JOB搭建教程
XXL-JOB - 分布式任务调度平台 WAR/JAR 包部署
Azkaban、Xxl-Job与Airflow对比分析
任务调度框架 quartz 和 xxl-job - 下

一、使用XXL-JOB的原因

1、 Quartz的不足

Quartz作为开源任务调度中的佼佼者，是任务调度的首选。但是在集群环境中，Quartz采用API的方式对任务进行管理，这样存在以下问题：

通过调用API的方式操作任务，不人性化。
需要持久化业务的QuartzJobBean到底层数据表中，系统侵入性相当严重。
调度逻辑和QuartzJobBean耦合在同一个项目中，这将导致一个问题，在调度任务数量逐渐增多，同时调度任务逻辑逐渐加重的情况下，此时调度系统的性能将大大受限于业务。

XXL-JOB弥补了Quartz的上述不足之处。

2. RemoteHttpJobBean

常规的Quartz的开发，任务逻辑一般维护在QuartzJobBean中，耦合很严重。

XXL-JOB中“调度模块”和“任务模块”完全解耦，调度模块中的所有调度任务使用同一个QuartzJobBean，即RemoteHttpJobBean。不同的调度任务将各自的调度参数维护在各自的扩展表数据中，当触发RemoteHttpJobBean执行时，将会解析不同的调度参数发起远程调用，调用各自的远程执行器服务。

这种调用模型类似RPC调用，RemoteHttpJobBean提供调用代理的功能，而执行器提供远程服务的功能。

3. 架构设计

XXL-JOB将调度行为抽象形成“调度中心”公共平台，而平台自身并不承担业务逻辑，“调度中心”只负责发起调度请求。

将任务抽象成分散的JobHandler，交由“执行器”统一管理，“执行器”负责接收调度请求并执行对应的JobHandler中的业务逻辑。

因此，“调度”和“任务”两部分可以解耦成调度模块和执行模块，提高业务系统的整体稳定性和扩展性：

调度模块（调度中心）：负责管理调度信息，按照调度配置发出调度请求，自身不承担业务代码。调度系统与任务解耦，提高了系统可用性和稳定性，同时调度系统的性能不再受限于任务模块；支持可视化、简单且动态的管理调度信息，包括任务的新建、更新、删除，GLUE开发和任务报警等，所有上述操作都会实时生效，同时支持监控调度结果以及执行日志，支持执行器Failover。
执行模块（执行器）：负责接收调度请求并执行任务逻辑。任务模块专注于任务的执行等操作，开发和维护更加简单和高效；接收“调度中心”的执行请求、终止请求和日志请求等。

XXL-JOB的系统架构，如下图所示：

三、建立SpringBoot示例工程

通过STS建立SpringBoot的示例工程，名称为xxl-job-demo。本文采用的配置如下：

SpringBoot版本为2.0.1
项目依赖关系选择Web

这个示例工程将作为“执行器”，接收“调度中心”的调度请求，然后将Redis中的消息输出至任务日志。具体的创建步骤，本文不再赘述。

这个示例工程会用到Jedis客户端，其配置文件会交给Disconf托管，请参考《基于注解的分布式配置文件和配置项》，本文不再赘述。

四、整合XXL-JOB执行器

1. Maven依赖

打开pom.xml文件，添加XXL-JOB执行器的依赖关系，如下所示：

<dependency>
   <groupId>com.xuxueli</groupId>
   <artifactId>xxl-job-core</artifactId>
   <version>1.9.1</version>
</dependency>

2. 执行器配置文件

打开application.properties文件，添加执行器配置。application.properties文件的全部内容，如下所示：

image.png

XXL-JOB执行器的相关配置项的意义，如下所示：

xxl.job.admin.addresses
调度中心的部署地址。若调度中心采用集群部署，存在多个地址，则用逗号分隔。执行器将会使用该地址进行”执行器心跳注册”和”任务结果回调”。
xxl.job.executor.appname
执行器的应用名称，它是执行器心跳注册的分组依据。
xxl.job.executor.ip
执行器的IP地址，用于”调度中心请求并触发任务”和”执行器注册”。执行器IP默认为空，表示自动获取IP。多网卡时可手动设置指定IP，手动设置IP时将会绑定Host。
xxl.job.executor.port
执行器的端口号，默认值为9999。单机部署多个执行器时，注意要配置不同的执行器端口。
xxl.job.accessToken
执行器的通信令牌，非空时启用。
xxl.job.executor.logpath
执行器输出的日志文件的存储路径，需要拥有该路径的读写权限。
xxl.job.executor.logretentiondays
执行器日志文件的定期清理功能，指定日志保存天数，日志文件过期自动删除。限制至少保存3天，否则功能不生效。

注意，XXL-JOB执行器的配置文件也可以交给Disconf进行托管。

3. 执行器配置类

还需要新建一个执行器配置类，用来读取执行器的配置信息。新建一个名为com.example.demo.config的包，然后在这个包中新建一个名为XxlJobConfig的类，主要内容如下所示：

XxlJobConfig配置类有两点需要注意：

组件扫描
第2行使用@ComponentScan注解，扫描com.example.demo.jobhandler包，将其中的任务处理器加载至Spring容器。
获取执行器实例
第29行的xxlJobExecutor()方法会实例化一个XXL-JOB执行器对象，执行器初始化时调用它的start()方法，执行器销毁时调用它的destroy()方法。

五、执行器

在浏览器中访问http://10.15.1.21:8081，登录XXL-JOB调度中心，默认的用户名/密码是admin/123456。

点击进入“执行器管理”页面，然后点击“新增执行器”按钮，弹出新增执行器窗口，如下图所示：

新增执行器时，需要填写的信息，如下所示：

AppName：这是用来唯一标识每个执行器集群的应用名称，执行器会周期性地以AppName为参数进行自动注册。可通过该配置自动发现注册成功的执行器，供任务调度时使用。
名称：执行器的名称，因为AppName限制字母数字等组成，可读性不强，名称可以提高执行器的可读性。
排序：执行器的排序，系统中需要执行器的地方，如任务新增，将会按照该排序读取可用的执行器列表。
注册方式：调度中心获取执行器地址的方式，有以下两种：
- 自动注册：执行器自动进行执行器注册，调度中心通过底层注册表可以动态发现执行器机器地址。
- 手动录入：人工手动录入执行器的地址信息，多地址逗号分隔，供调度中心使用。
机器地址：只有在“注册方式”为“手动录入”时可编辑，支持人工维护执行器的地址信息。

注意，AppName的取值应该和示例工程的application.properties文件中的xxl.job.executor.appname字段的取值相同，注册方式应该选择自动注册。新增完成之后，就可以在执行器列表中看到新建的执行器，如下图所示：

注意，执行器列表的“OnLine 机器地址”字段会在执行器启动时，显示执行器的IP地址和端口号。

六、任务

1. 任务调度属性

在XXL-JOB调度中心，点击进入“任务管理”页面，然后点击“新增任务”按钮，弹出新增任务窗口，如下图所示：

新增任务时，需要填写的信息，如下所示：

执行器：任务绑定的执行器，任务触发调度时将会自动发现注册成功的执行器，实现任务自动发现功能；另一方面，也可以方便地进行任务分组。每个任务必须绑定一个执行器，可以在“执行器管理”页面进行设置。
任务描述：任务的描述信息，便于任务管理。
路由策略：当执行器集群部署时，提供丰富的路由策略，包括：
- FIRST（第一个）：固定选择第一个机器。
- LAST（最后一个）：固定选择最后一个机器。
- ROUND（轮询）：轮流选择每台机器。
- RANDOM（随机）：随机选择在线的机器。
- CONSISTENT_HASH（一致性HASH）：每个任务按照Hash算法固定选择某一台机器，且所有任务均匀散列在不同机器上。
- LEAST_FREQUENTLY_USED（最不经常使用）：使用频率最低的机器优先被选举。
- LEAST_RECENTLY_USED（最近最久未使用）：最久为使用的机器优先被选举。
- FAILOVER（故障转移）：按照顺序依次进行心跳检测，第一个心跳检测成功的机器选定为目标执行器并发起调度。
- BUSYOVER（忙碌转移）：按照顺序依次进行空闲检测，第一个空闲检测成功的机器选定为目标执行器并发起调度。
- SHARDING_BROADCAST(分片广播)：广播触发对应集群中所有机器执行一次任务，同时传递分片参数；可根据分片参数开发分片任务。
Cron：触发任务执行的Cron表达式，请参考Cron的维基页面。
运行模式
- BEAN模式：任务以JobHandler的方式维护在执行器端；需要结合 “JobHandler”属性匹配执行器中的任务；
- GLUE模式(Java)：任务以源码方式维护在调度中心；该模式的任务实际上是一段继承自IJobHandler的Java类代码并以“groovy”源码的方式维护，它在执行器项目中运行，可使用@Resource/@Autowire注入执行器里中的其他服务；
- GLUE模式(Shell)：任务以源码方式维护在调度中心；该模式的任务实际上是一段“shell”脚本；
- GLUE模式(Python)：任务以源码方式维护在调度中心；该模式的任务实际上是一段“python”脚本；
- GLUE模式(NodeJS)：任务以源码方式维护在调度中心；该模式的任务实际上是一段“nodejs”脚本；
JobHandler：只有在运行模式为“BEAN模式”时生效，对应执行器中新开发的JobHandler类的“@JobHandler”注解自定义的value值。
子任务：每个任务都拥有一个唯一的任务ID（任务ID可以从任务列表获取），当本任务执行结束并且执行成功时，将会触发子任务ID所对应的任务的一次主动调度。
阻塞处理策略：调度过于密集，执行器来不及处理时的处理策略：
- 单机串行（默认）：调度请求进入单机执行器后，调度请求进入FIFO队列并以串行方式运行。
- 丢弃后续调度：调度请求进入单机执行器后，发现执行器存在运行的调度任务，本次请求将会被丢弃并标记为失败。
- 覆盖之前调度：调度请求进入单机执行器后，发现执行器存在运行的调度任务，将会终止运行中的调度任务并清空队列，然后运行本地调度任务。
失败处理策略：调度失败时的处理策略：
- 失败告警（默认）：调度失败和执行失败时，都将会触发失败报警，默认会发送报警邮件。
- 失败重试：调度失败时，除了进行失败告警之外，将会自动重试一次；注意在执行失败时不会重试，而是根据回调返回值判断是否重试。
任务参数：任务执行所需的参数，多个参数时用逗号分隔，任务执行时将会把多个参数转换成数组传入。
报警邮件：任务调度失败时邮件通知的邮箱地址，支持配置多邮箱地址，配置多个邮箱地址时用逗号分隔。
负责人：任务的负责人。

注意，编辑任务时也会弹出类似的窗口，其中的输入项请参考新增任务窗口。

接下来，本文将详述BEAN模式任务和GLUE（Java）模式任务，以及分片广播路由策略，这些是XXL-JOB最常用的功能。

2. BEAN模式

任务逻辑以JobHandler的形式存在于“执行器”所在项目中，开发流程如下：

Step-1 开发JobHandler代码

在示例工程中，新建com.example.demo.jobhandler包，用来存储任务的业务逻辑代码。在这个包中新建DemoJobHandler任务类，关键代码如下所示：

上述代码有三点需要注意：

必须使用XXL-JOB的@JobHandler注解（第1行），指定JobHandler的名称为“demoJobHandler”，在调度中心新建任务的JobHandler字段的取值要与此相同。
必须继承IJobHandler抽象类（第3行），并且实现它的execute()方法，这是实现任务逻辑的方法。
IJobHandler抽象类还有init()方法和destroy()方法，这两个方法是空方法，在任务实例初始化和销毁时调用，任务实现类可以选择性地覆盖这两个方法。

Step-2 新建调度任务

参考上文“任务调度属性”对新建的任务进行参数配置，运行模式选择“BEAN模式”，JobHandler属性填写任务注解@JobHandler中定义的值，如下图所示：

调度中心会每隔15分钟调度一次demoJobHandler任务。

3. GLUE（Java）模式

任务以源码方式维护在调度中心，支持通过Web IDE在线更新，实时编译和生效，因此不需要指定JobHandler。开发流程如下：

Step-1 新建调度任务

参考上文“任务调度属性”对新建的任务进行参数配置，运行模式选择“GLUE模式(Java)”，如下图所示：

调度中心会每隔15分钟调度一次这个任务。

Step-2 开发任务代码

在任务列表中选中指定的GLUE（Java）任务，点击该任务右侧的“GLUE”按钮，将会前往GLUE任务的Web IDE界面，在该界面支持对任务代码进行开发（也可以在IDE中开发完成后，复制粘贴到编辑中）。

版本回溯功能：在GLUE任务的Web IDE界面，选择右上角下拉框“版本回溯”，会列出该GLUE任务的更新历史（支持30个版本的版本回溯），选择相应版本即可显示该版本代码，保存后GLUE代码即回退到对应的历史版本。GLUE任务代码和Web IDE界面，如下图所示：

4. 分片广播任务

执行器集群部署时，任务路由策略选择“分片广播”的情况下，一次任务调度将会广播触发对应集群中所有执行器执行一次任务，同时传递分片参数，可以根据分片参数开发分片任务。

“分片广播”以执行器为维度进行分片，支持动态扩容执行器集群从而动态增加分片数量，协同进行业务处理；在进行大数据量业务操作时可显著提升任务处理能力和速度。

“分片广播”和普通任务开发流程一致，不同之处在于可以获取分片参数，通过分片参数进行分片业务处理。开发流程如下：

Step-1 开发JobHandler代码

在示例工程的com.example.demo.jobhandler包中，新建ShardingJobHandler任务类，关键代码如下所示：

上述代码的第9行获取分片参数，第10行获取分片参数的两个属性：

shardingVO.getIndex()
当前分片序号（从0开始），执行器集群列表中当前执行器的序号。
shardingVO.getTotal()
总分片数，执行器集群的总机器数量。

Step-2 新建调度任务

参考上文“任务调度属性”对新建的任务进行参数配置，运行模式选择“BEAN模式”，路由策略选择“分片广播”，JobHandler属性填写任务注解@JobHandler中定义的值，如下图所示：

调度中心会每隔15分钟广播调度一次shardingJobHandler任务。

分片广播的路由策略不仅适用于BEAN运行模式，而且也适用于GLUE（Java）运行模式。这项功能适用于以下业务场景：

分片任务场景
10个执行器的集群来处理10w条数据，每台机器只需要处理1w条数据，耗时降低10倍。
广播任务场景
广播执行器机器运行shell脚本、广播集群节点进行缓存更新等。

5. 任务列表

在XXL-JOB调度中心，点击进入“任务管理”页面，可以看到指定执行器的任务列表，如下图所示：

在任务列表中，可以看到每个任务的任务ID、任务描述、运行模式、Cron、负责人和状态等信息。用户可以对任务进行以下几种操作：

执行：手动触发一次任务调度，不影响原有调度规则。
暂停/恢复：可对任务进行“暂停”和“恢复”操作。需要注意的是，此处的暂停/恢复仅针对任务的后续调度触发行为，不会影响到已经触发的调度任务。
日志：可以查看任务历史调度日志。在历史调入日志界面可查看每次任务调度的调度结果、执行结果等，点击“执行日志”按钮可查看执行器完整日志。
编辑：在弹出的“编辑任务”界面更新任务属性后保存即可，可以修改设置的任务属性信息。
GLUE：该操作仅针对GLUE任务。将会前往GLUE任务的Web IDE界面，在该界面支持对任务代码进行开发。
删除：删除这个任务。

七、任务调度日志

在XXL-JOB调度中心，点击进入“调度日志”页面。

1. 查看调度日志

在“调度日志”页面可以查看每次任务调度的调度结果、执行结果等信息，如下图所示：

从调度日志可以获取以下信息：

调度时间：“调度中心”触发本次调度并向“执行器”发送任务执行信号的时间。
调度结果：“调度中心”触发本次调度的结果，200表示成功，500或其他表示失败。
调度备注：“调度中心”触发本次调度的日志信息。
执行时间：“执行器”中本次任务执行结束后回调的时间。
执行结果：“执行器”中本次任务执行的结果，200表示成功，500或其他表示失败。
执行备注：“执行器”中本次任务执行的日志信息。

在示例工程中，调度日志位于/data/applogs/xxl-job/xxl-job-demo.log，可以在logback.xml文件中进行配置。

2. 查看执行日志

点击某行日志右侧的 “执行日志” 按钮，可跳转至执行日志界面，可以查看业务代码中打印的完整日志，如下图：

在示例工程中，执行日志位于/data/applogs/xxl-job/jobhandler目录中，可以在logback.xml文件中进行配置。

3. 终止运行中的任务

这项功能只针对执行中的任务。在任务日志页面，点击右侧的“终止任务”按钮，将会向本次任务对应的执行器发送任务终止请求，将会终止掉本次任务，同时会清空掉整个任务执行队列，如下图所示：

任务终止是通过“interrupt”执行线程的方式实现的，将会触发“InterruptedException”异常。因此，如果JobHandler内部捕获到该异常并消化掉的话，任务终止功能将不起作用。

因此, 如果遇到上述任务终止不起作用的情况, 需要在JobHandler中针对“InterruptedException”异常进行特殊处理（向上抛出）。另外，在JobHandler中开启子线程时，子线程也不可捕获处理“InterruptedException”，应该主动向上抛出。

4. 删除执行日志

在任务日志页面，选择执行器和任务之后，点击右侧的“清理”按钮将会出现“日志清理”弹框，弹框中支持选择不同类型的日志清理策略，选中后点击“确定”按钮即可进行日志清理操作，如下图所示：

详情介绍:

更新主题详情

420天以来，Java架构更新了 888个主题，已经有156+位同学加入。微信扫码关注java架构，获取Java面试题和架构师相关题目和视频。上述相关面试题答案，尽在Java架构中。

最后：特别感谢以下博客

1、分布式任务调度平台XXL-JOB搭建教程
 2、XXL-JOB的基本用法

分布式任务调度平台XXL-JOB
《分布式任务调度平台XXL-JOB》一、简介 1.1 概述 XXL-JOB是一个轻量级分布式任务调度框架，其核心...
《分布式任务调度平台XXL-JOB》之初学入门记录
Java Web开发——MySQL数据库的安装与配置《分布式任务调度平台XXL-JOB》环境搭建所需
思考--xxl-job简单的记录
为何选择xxl-job这个任务调度框架？ xxl-job 首先采用分布式任务调度框架，可以进行分布式部署， xxl...
k3s 运行xxl-job 跑powershell脚本
参考文档分布式任务调度平台XXL-JOB (xuxueli.com)[https://www.xuxueli.c...
SpringBoot入门建站全系列（三十二）接入xxl-job分
SpringBoot入门建站全系列（三十二）接入xxl-job分布式任务调度平台一、概述 XXL-JOB是一个轻...
分布式任务调度平台 XXL-JOB
参考分布式任务调度平台xxl-job 源码下载地址 https://github.com/xuxueli/xxl...
分布式任务调度平台XXL-JOB搭建教程
一、使用XXL-JOB的原因 1、 Quartz的不足 Quartz作为开源任务调度中的佼佼者，是任务调度的首选。...
XXL-JOB - 分布式任务调度平台 WAR/JAR 包部署
官方网址:分布式任务调度平台[https://www.xuxueli.com/xxl-job/] 本地启动执行S...
Azkaban、Xxl-Job与Airflow对比分析
概述 Xxl-Job 简述 XXL-JOB是一个国内轻量级分布式任务调度平台，其核心设计目标是开发迅速、学习简单、...
任务调度框架 quartz 和 xxl-job - 下
quartz 的分析见上一篇博文简介 xxl-job 是一个轻量级分布式任务调度平台，XXL-JOB 目前已接...

分布式任务调度平台XXL-JOB搭建教程

一、使用XXL-JOB的原因

1、 Quartz的不足

2. RemoteHttpJobBean

3. 架构设计

三、建立SpringBoot示例工程

四、整合XXL-JOB执行器

1. Maven依赖

2. 执行器配置文件

3. 执行器配置类

五、执行器

六、任务

1. 任务调度属性

2. BEAN模式

Step-1 开发JobHandler代码

Step-2 新建调度任务

3. GLUE（Java）模式

Step-1 新建调度任务

Step-2 开发任务代码

4. 分片广播任务

Step-1 开发JobHandler代码

Step-2 新建调度任务

5. 任务列表

七、任务调度日志

1. 查看调度日志

2. 查看执行日志

3. 终止运行中的任务

4. 删除执行日志

最后：特别感谢以下博客

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读