美文网首页大数据开发
spring-hadoop和spring-batch对MR整合,

spring-hadoop和spring-batch对MR整合,

作者: 葡萄喃喃呓语 | 来源:发表于2016-10-22 15:23 被阅读331次

干货(3)-spring-batch+spring-hadoop+olh整合 - Hadoop分布式数据分析平台-炼数成金-Dataguru专业数据分析社区
http://f.dataguru.cn/thread-155752-1-1.html
参加adc大会回来,讲师们的一个观点让我很受启发:就是淘宝和百度的Hadoop工程师们,会写10几个步骤的连续的MR作业来做运算,也不会去写低效 hive。在我的实际工作中,最多有四步的MR运算,代码已经比较混乱了,并不易于维护。这两天用spring-hadoop和spring-batch对MR整合,形成工作流,代码逻辑清晰很多,以后维护也方便了。

总的来说是两大步骤,先对原始日志进行ETL,然后用OLH将洗过的数据导入到oracle中,注意ETL中分为两步:先用脚本做一些初始化工作,我这里随便写了点代码,实际中可以拷贝数据,删除已存在的output目录等等;第二步是真正的ETL执行。通过定义StepExecutionListener和JobExecutionListener,我们可以在任务完成时进行回调操作,完成一些逻辑处理,在我的例子中就是com.etl.listener.EtlInitStepListener和
com.etl.listener.EtlJobListener。所有的JobParameters都在java代码中赋值,除了
fieldTerminator,这在实际应用中具有很大的灵活性。
项目采用maven管理,pom如下,

相关文章

  • spring-hadoop和spring-batch对MR整合,

    干货(3)-spring-batch+spring-hadoop+olh整合 - Hadoop分布式数据分析平台-...

  • Spring Data Hbase

    https://docs.spring.io/spring-hadoop/docs/current/referen...

  • spring batch @EnableBatchProcess

    https://docs.spring.io/spring-batch/4.2.x/reference/html/...

  • 使用steam开发HTC项目

    前言:使用steam体验 将mr项目转成htc 步骤一、下载htc 插件包 SteamVR Plugin | 整合...

  • Mr Good和Mr Right

    字数 1469 1. 初见Mr Good! 窈窕淑女,君子好逑。23岁的小青是个地道的都市女孩,有着明朗的个性,姣...

  • IDEA GitLab-Sonarlint插件

    注:此插件为GitLabProjects与Sonarlint的整合,需先卸载这两个插件。 当提交MR时会进行Son...

  • 项目整合管理重点知识问答

    1. Q: 什么是整合管理? 整合什么以及如何整合? A:项目整合管理包括对隶属于项目管理过程组的各种过程和项目管...

  • 《MR和MISS》

    一本小说可以放下很多个故事,可以记起很多人,这些故事和人在不停的更换,哪个是正确的哪个是错的可它们也在互相牵扯着,...

  • 家庭系统整合(八)

    系统整合的“可为” 与“不可为” 任何学问都有边界和有限性。系统整合也不例外。 系统整合的目标管理,分为对当事人和...

  • Mr.Li和见殊小姐

    Mr.Li和见殊小姐是一对儿~~lesbian ,先别污,她们很纯洁。 Mr.Li是个堂堂正正的女汉子,装备之齐全...

网友评论

    本文标题:spring-hadoop和spring-batch对MR整合,

    本文链接:https://www.haomeiwen.com/subject/uflhuttx.html