美文网首页
ETL工具Kettle初探

ETL工具Kettle初探

作者: CoryLiu | 来源:发表于2020-06-07 20:20 被阅读0次

    公司有一个基于ERP数据的Discover报表系统需要重构,以提升报表运行效率及减少运维成本。

    分析比较了很多报表平台及BI工具后,我们发现首先需要一个ETL工具将数据从ERP DB中导出。在众多ETL工具中,我们选择了Kettle,主要基于如下几个原因:

    1. 功能强大
      Kettle不仅可以读取广泛的数据来源,不仅包括Oracle、Mysql等一众关系型数据库,也支持从CVS,Json,XML文件读取,甚至可以透过http 获取所需数据。且功能还在不断增加中。

    2. 使用广泛
      已经有很多人在使用此软件,在网络上可以找到非常多的教材和学习视频。

    3. 免费开源
      支持Apache 2.0开源协议,不仅适合个人、也适合商业使用。

    下载安装

    1. 首先下载最新版的安装软件,现在最新版是9.0
      下载后,无需安装,直接解压到合适目录即可。我解压的目录是 D:\tools 。

    2. 然后是设置JAVA_HOME环境变量,如果电脑还没有安装JDK,则先需要安装一个JDK,安装好JDK后,将JDK安装目录加到 JAVA_HOME环境变量中。

    3. 再下来是下载所需连接数据库对应的JDBC驱动,需要下载JDK版本对应的数据库JDBC驱动,我安装的是JDK 1.8,需连接的是Oracle DB, 所以下载了ojava6.jar文件,并拷贝到Kettle lib目录 (D:\tools\pdi-ce-9.0.0.0-423\data-integration\lib)。

    4. 最后启动程序,点开spoon.bat文件,即可开始使用了。
      (D:\tools\pdi-ce-9.0.0.0-423\data-integration\spoon.bat)

    Kettle启动界面

    具体使用方法

    建议到B站上搜索Kettle观看,我现在正在学习的视频如下:
    2019kettle8.2最新教程

    附:gitlab Kettle 项目源代码
    pentaho-kettle

    相关文章

      网友评论

          本文标题:ETL工具Kettle初探

          本文链接:https://www.haomeiwen.com/subject/gawqtktx.html