美文网首页
spring batch--不支持文件的读取

spring batch--不支持文件的读取

作者: 刘启朋 | 来源:发表于2019-04-14 21:39 被阅读0次

        最近,在对一个新接手的项目进行功能的添加,关于批量数据导入数据库的功能。项目中已经有了类似的批量数据处理的功能,于是就梳理之前的代码。发现了spring batch这个框架。说实话,spring 之前一直都在接触,使用。其实也只是使用一些基本的功能。对于一些其他的spring模块了解的并不是很多。所以,当时看了一遍代码,没怎么看懂。然后上网搜了一些关于spring batch 的介绍,发现了一张图片很好的解释了spring batch 的工作流程。



    Job数据流

    首先,Spring Batch运行的基本单位是一个Job,一个Job就做一件批处理的事情。

    一个Job包含很多Step,step就是每个job要执行的单个步骤。

    如下图所示,Step里面,会有Tasklet,Tasklet是一个任务单元,它是属于可以重复利用的东西。

    然后是Chunk,chunk就是数据块,你需要定义多大的数据量是一个chunk。

    Chunk里面就是不断循环的一个流程,读数据,处理数据,然后写数据。Spring Batch会不断的循环这个流程,直到批处理数据完成。

    read是负责读取数据。spring batch 有很多其实现,能够针对不同的场景进行选择。例如:经常会用到的文件读取实现FlatFileItemReader,能够针对大部分文件进行读取。

    process是数据处理器,在数据流从read到writer过程中,可以对数据流进行校验。使之能够对输入的数据进行检查。

    writer是负责写数据。spring batch也有很多实现。例如:AmqItemWriter,FlatFileItemWriter,MybatisBatchItemWriter,ListItemWriter等等。

    在对以上的基本概念和流程进行了解后,对于项目的功能已经有了初步的代码实现。


    就当开始编写代码时,遇到了一个问题。spring batch提供的reader,不能读取项目中所使用的文件。项目中使用的是.gz的压缩型文件,spring batch FlatFileItemReader 不能正确的读取文件内容。尝试着对.gz文件的解压文件进行读取,能够得到正确文件内容。如果这样的话,每次读取文件都要先解压再去读取,比较麻烦。就在一筹莫展之际,突然灵机一动,联想到之前做过的项目能够对.gz文件进行读取的GZIPInputStream,其实也算是一种数据流,既然都是数据流,能不能把.gz的数据流适配到FlatFileItemReader中。说干就干,于是翻看了FlatFileItemReader的源码,发现其接收一个Resource的参数。其中就是对数据流的包裹。

    FaltFileItemReader

    截图中显示通过resource创建出BufferedReader能够对文件进行行读取操作。

    然后我通过继承Resource接口然后通过对象适配器模式,适配FileSystemResource。创建GZIPFileResource类。

    GzipFileResource

    这样就能支持.gz文件的读取。

    其中spring batch 还提供了listener,能够对job进行监听,可以在job完成前后进行一些自定义操作。

    总结:写代码之前,不要盲目的去写代码,写代码之前可以先去找一些现有的框架,试着去解决我们的需求,不要重复造轮子,从别人的轮子中吸取优秀的编码思想。然后,通过阅读源码,解决我们做项目时遇到的问题。

    相关文章

      网友评论

          本文标题:spring batch--不支持文件的读取

          本文链接:https://www.haomeiwen.com/subject/ohnswqtx.html