公司有一个基于ERP数据的Discover报表系统需要重构,以提升报表运行效率及减少运维成本。
分析比较了很多报表平台及BI工具后,我们发现首先需要一个ETL工具将数据从ERP DB中导出。在众多ETL工具中,我们选择了Kettle,主要基于如下几个原因:
-
功能强大
Kettle不仅可以读取广泛的数据来源,不仅包括Oracle、Mysql等一众关系型数据库,也支持从CVS,Json,XML文件读取,甚至可以透过http 获取所需数据。且功能还在不断增加中。 -
使用广泛
已经有很多人在使用此软件,在网络上可以找到非常多的教材和学习视频。 -
免费开源
支持Apache 2.0开源协议,不仅适合个人、也适合商业使用。
下载安装
-
首先下载最新版的安装软件,现在最新版是9.0 。
下载后,无需安装,直接解压到合适目录即可。我解压的目录是 D:\tools 。 -
然后是设置JAVA_HOME环境变量,如果电脑还没有安装JDK,则先需要安装一个JDK,安装好JDK后,将JDK安装目录加到 JAVA_HOME环境变量中。
-
再下来是下载所需连接数据库对应的JDBC驱动,需要下载JDK版本对应的数据库JDBC驱动,我安装的是JDK 1.8,需连接的是Oracle DB, 所以下载了ojava6.jar文件,并拷贝到Kettle lib目录 (D:\tools\pdi-ce-9.0.0.0-423\data-integration\lib)。
-
最后启动程序,点开spoon.bat文件,即可开始使用了。
(D:\tools\pdi-ce-9.0.0.0-423\data-integration\spoon.bat)
具体使用方法
建议到B站上搜索Kettle观看,我现在正在学习的视频如下:
2019kettle8.2最新教程
附:gitlab Kettle 项目源代码
pentaho-kettle
网友评论