Azkaban实战-多job工作流案例

作者: Movle | 来源:发表于2020-05-10 00:21 被阅读0次

Azkaban实战-多job工作流案例
Azkaban实战-单一job案例
Azkaban四个应用案例
Azkaban工作流引擎和Flume数据采集
Hadoop批处理调度器Azkaban操作
Azkaban任务上传，设置依赖和调度
Azkaban安装
Azkaban02:配置job工作流
大数据技术之azkaban
删除azkaban的执行历史

0.数据源：

word.txt:

AAA
BBB
DDD
CCC
AAA
Movle
Kai Movle
BBB yue

word.txt

1.创建有依赖关系的多个job描述

第一个job：1.job

vi 1.job

添加内容：

type=command
command=/opt/module/hadoop-2.8.4/bin/hadoop fs -put /opt/module/datas/word.txt /

第二个job：2.job依赖1.job

vi 2.job

添加内容：

type=command
command=/opt/module/hadoop-2.8.4/bin/hadoop jar /opt/module/hadoop-2.8.4/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.8.4.jar wordcount /word.txt /out
dependencies=1

2.注意：将所有job资源文件打到一个zip包中

3.在azkaban的web管理界面创建工程并上传zip包

执行

4.查看结果

结果-查看对word.txt进行wordcount的结果

2.job的运行结果

思考：

将student.txt文件上传到hdfs，根据所传文件创建外部表，再将表中查询到的结果写入到本地文件

网友评论

本文标题：Azkaban实战-多job工作流案例

本文链接：https://www.haomeiwen.com/subject/mxdrnhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Azkaban实战-多job工作流案例

0.数据源：

1.创建有依赖关系的多个job描述

2.注意：将所有job资源文件打到一个zip包中

3.在azkaban的web管理界面创建工程并上传zip包

4.查看结果

相关文章

Azkaban实战-多job工作流案例

Azkaban实战-单一job案例

Azkaban四个应用案例

Azkaban工作流引擎和Flume数据采集

Hadoop批处理调度器Azkaban操作

Azkaban任务上传，设置依赖和调度

Azkaban安装

Azkaban02:配置job工作流

大数据技术之azkaban

删除azkaban的执行历史

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读