美文网首页
Azkaban介绍

Azkaban介绍

作者: 你说你要个夏天 | 来源:发表于2019-01-07 11:14 被阅读0次

    Azkaban介绍

    一、登陆:https://192.168.99.62:8443

    二、首页介绍

    projects:最重要的部分,创建一个工程,所有flows将在工程中运行。

    scheduling:显示定时任务

    executing:显示当前运行的任务

    history:显示历史运行任务

    三、工程介绍

    一个工程包含一个或多个flows,一个flow包含多个job。job是你想在azkaban中运行的一个进程,可以是简单的linux命令,可是java程序,也可以是复杂的shell脚本,当然,如果你安装相关插件,也可以运行插件。一个job可以依赖于另一个job,这种多个job和它们的依赖组成的图表叫做flow。

    Azkaban job类型:

    1.command:Linux shell命令行任务

    2.gobblin:通用数据采集工具

    3.hadoopJava:运行hadoopMR任务

    4.java:原生java任务

    5.hive:支持执行hiveSQL

    6.pig:pig脚本任务

    7.spark:spark任务

    8.hdfsToTeradata:把数据从hdfs导入Teradata

    9.teradataToHdfs:把数据从Teradata导入hdfs

    Job设置

    1.设置每个job中的命令:

    type=command

    command=echo "hello"

    command.1=echo "world"

    2. 可以配置job失败重启次数,及间隔时间,比如,上述ftp获取日志,我可以配置重试12次,每隔5分钟一次:

    type=command

    command=wget "ftp://file1" -O/data/file1

    retries=12

    #单位毫秒

    retry.backoff=300000

    job编写

    1.command.job

    type=command

    #

    执行sh脚本,建议这样做,后期只需维护脚本就行了,azkaban定义工作流程

    command=sh /job/o2o_2_hive.sh

    #所依赖的job名称

    dependencies=o2o_clean_data

    2.java.job:

    type=javaprocess

    classpath=./lib/*,${azkaban.home}/lib/*

    java.class=com.dataeye.java.MyJavaJob

    3.wordcount.job

    type=hadoopJava

    job.extend=false

    job.class=azkaban.jobtype.examples.java.WordCount

    classpath=./lib/*,${azkaban.home}/lib/*

    force.output.overwrite=true

    input.path=/data/yann/input

    output.path=/data/yann/output

    四Azkaban使用

    1.    开启服务:bin/azkaban-web-start.sh        bin/azkaban-executor-start.sh

    2.    编写xx.job文件压缩成zip包放到windows上

    3.    登陆:https://master:8443   账号:admin 密码:admin

    4.    CreatePorject

    5.    填入工程名和描述信息并createproject

    6.    Uplode压缩好的zip包

    7.    schedule定时任务或者execute单次执行

    8.    Flow view:流程视图。可以禁用,启用某些job

    Notification:定义任务成功或者失败是否发送邮件

    Failure Options:定义一个job失败,剩下的job怎么执行

    Concurrent:并行任务执行设置

    Flow Parametters:参数设置

    9.    设置好上述参数,点击execute

    绿色代表成功,蓝色是运行,红色是失败。可以查看job运行时间,依赖和日志,点击details可以查看各个job运行情况。

    10.  点击shedule设置定时任务

    1.    Azkaban各种类型的Job编写:https://www.jianshu.com/p/f2310a5c38c6

    2.    如何写一个好的接口:https://www.cnblogs.com/panpanwelcome/p/8184107.html

    3.    [endif]Azkaban API 接口文档汇总:https://blog.csdn.net/u012965373/article/details/82853740

    4.    如何写好一个接口:https://blog.csdn.net/onedaycbfly/article/details/79477609

    5.    Java接口:http://www.runoob.com/java/java-interfaces.html

    6.    java如何写接口给别人调用:https://blog.csdn.net/greatkendy123/article/details/52818466

    7.    Azkaban的AJAX的RestFul接口调用事例:https://blog.csdn.net/qq_20641565/article/details/72379506

    8.    Java调用Azkaban相关服务:https://blog.csdn.net/shirukai/article/details/80841875

    9.    Azkaban安装部署:https://www.cnblogs.com/zhu520/p/7652900.html

    相关文章

      网友评论

          本文标题:Azkaban介绍

          本文链接:https://www.haomeiwen.com/subject/bcoyrqtx.html