美文网首页
Azkaban简单定时任务-使用教程

Azkaban简单定时任务-使用教程

作者: vcancy | 来源:发表于2018-03-07 21:52 被阅读0次

    Azkaban是由Linkedin公司推出的一个批量工作流任务调度器,用于在一个工作流内以一个特定的顺序运行一组工作和流程。Azkaban使用job配置文件建立任务之间的依赖关系,并提供一个易于使用的web用户界面维护和跟踪你的工作流。

    1.登录Azkaban

    2.菜单栏

    projects:最重要的部分,创建一个工程,所有flows将在工程中运行。

    scheduling:显示定时任务

    executing:显示当前运行的任务

    history:显示历史运行任务

    HDFS:Azkaban结合hdfs的插件,显示HDFS服务器上的文件信息

    Reportal:定制化定时邮件报表,数据源可以是Hive,pig,Teradata

    3.创建工程(任务)

    创建之前我们先了解下之间的关系,一个工程包含一个或多个flows,一个flow包含多个job。job是你想在azkaban中运行的一个进程,可以是简单的linux命令,可是java程序,也可以是复杂的shell脚本,当然,如果你安装相关插件,也可以运行插件。一个job可以依赖于另一个job,这种多个job和它们的依赖组成的图表叫做flow。

    1)首先创建一个工程,填写名称和描述,比如test-001。

    注意:project的name不支持中文

    2)新建project后可以通过upload上传zip格式的任务包

    3)azkaban可以运行unix命令,也可以运行python脚本

    在本地新建一个名为command.job的文件内容如下:

    type=command

    command=echo “test 001"

    将上述job打成zip包,点击upload选择zip包上传。

    可使用Run job执行command.job

    Flows:工作流程,如果有多个job组成,例子只有一个job

    Permissions:权限管理

    Project Logs:工程日志

    4)使用Schedule指定定时计划任务

    5)进入Schduling菜单可查看所有的定时任务列表

    相关文章

      网友评论

          本文标题:Azkaban简单定时任务-使用教程

          本文链接:https://www.haomeiwen.com/subject/gswsfftx.html