美文网首页MySQLKettle
Kettle-Pentaho-Data-Integration-

Kettle-Pentaho-Data-Integration-

作者: Lemonlzy | 来源:发表于2020-01-08 22:30 被阅读0次

    前言


    最近需要做仪表盘相关的项目,用到了ETL工具Kettle,下载链接:data-integration-kettle,这是一款基于Java开发的工具,当然,Java环境变量相关配置就不在这里说明了,不过相信大家电脑上一般也都配好了环境变量,那么理论上来说应该解压Kettle即可用才对。然而在进行数据库连接时,测试连接抛出了一个报错:

    错误连接数据库 [xxx] : org.pentaho.di.core.exception.KettleDatabaseException: 
    Error occurred while trying to connect to the database
    
    Driver class 'org.gjt.mm.mysql.Driver' could not be found, make sure the 'MySQL' driver (jar file) is installed.
    org.gjt.mm.mysql.Driver
    
    org.pentaho.di.core.exception.KettleDatabaseException: 
    Error occurred while trying to connect to the database
    
    Driver class 'org.gjt.mm.mysql.Driver' could not be found, make sure the 'MySQL' driver (jar file) is installed.
    org.gjt.mm.mysql.Driver
        at org.pentaho.di.core.database.Database.normalConnect(Database.java:477)
        at org.pentaho.di.core.database.Database.connect(Database.java:373)
        at org.pentaho.di.core.database.Database.connect(Database.java:344)
        ...
    

    解决办法


    问题很明显,数据库驱动问题,相信大家在遇到这个问题查找解决方案时,肯定会搜索到千篇一律的答案,即在data-integration\lib目录下放入mysql-connector-java.jar包即可。

    可能大部分人这样操作问题会得到解决,但是很遗憾,本人在lib目录下放入各个版本的jar包后,均不起作用,进而开始思考原因。找了许久,在jdk目录C:\Program Files\Java\jdk1.8.0_181\jre\lib\ext下,我发现不知道什么时候被我放入了一个mysql-connector-java-8.0.16.jar包,然后有了个推测:

    • Kettle基于Java启动
    • 数据连接的jar包首先从jdk目录读取
    • 若jdk目录不存在数据库驱动包,则从安装目录的lib目录下读取

    进过测试,测试结果如下:

    • 删除jdk目录下的所有数据库驱动包,删除data-integration\lib下的所有数据库驱动包,重启Kettle,连接数据库失败。
    • 删除jdk目录下的所有数据库驱动包,在data-integration\lib放入mysql-connector-java-5.1.48.jar数据库驱动包,重启Kettle,连接数据库成功。
    • 在jdk目录下放入mysql-connector-java-5.1.48.jar数据库驱动包,删除data-integration\lib下的所有数据库驱动包,重启Kettle,连接数据库成功。
    • 删除jdk目录下的所有数据库驱动包,在data-integration\lib放入mysql-connector-java-8.0.16.jar数据库驱动包,重启Kettle,连接数据库失败。
    • 在jdk目录下放入mysql-connector-java-8.0.16.jar数据库驱动包,删除data-integration\lib下的所有数据库驱动包,重启Kettle,连接数据库失败。
    • 在jdk目录下放入mysql-connector-java-8.0.16.jar、mysql-connector-java-5.1.48.ja数据库驱动包,删除data-integration\lib下的所有数据库驱动包,重启Kettle,连接数据库成功。

    其实到了这一步,问题的解决方案已经出来了,总结如下(后续结果为分析探讨为什么8.0+版本的jar包会失效):

    1. Kettle工具安装目录data-integration\lib放入mysql-connector-java-5.1.48.jar。
    2. Jdk目录C:\Program Files\Java\jdk1.8.0_181\jre\lib\ext放入mysql-connector-java-5.1.48.jar。
    3. 重启Kettle。
    4. 下载链接:mysql-connector-java-5.1.48 mysql-connector-java-8.0.16

    后续分析


    所以,问题现在变成了,为什么Kettle读取了mysql8.0+版本的数据库驱动包,仍然提示'org.gjt.mm.mysql.Driver' could not be found

    使用解压工具将mysql-connector-java-5.1.48.jar与mysql-connector-java-8.0.16.jar包解压,可以很明显看到二者的目录结构差别:

    mysql-5.1.48.png mysql-8.0.16.png

    显而易见,在5.0+的版本中,数据库驱动jar包提供了org.gjt.mm.mysql.Driver.class文件,然而在8.0+版本的数据库驱动jar包中,则根本没有这个路径,所以上述的测试中,在单独使用8.0+版本的jar包时,数据连接失败的原因也找到了,MySQL官方在新版本中更改了类文件的路径,而为了兼容性问题,Kettle仍然采用了老的路径,所以出现了可以使用低版本的jar包连接高版本数据库的情况。

    那么有没有办法使用8.0+的jar包呢,或者说Kettle工具为什么要以这种方式读取数据库驱动呢,可以更改吗?继续查。

    我们可以在Kettle数据库连接设置时,选择MySQL(因为本人需要连接的数据库是MySQL),点击下方特征列表,可看到对应的参数:

    driverClass.png

    可以看到这里已经被定义好了,以org.gjt.mm.mysql.Driver读取,其实,在Java与MySQL数据库连接中,5.0+版本的连接连接是这样定义的:

    driverClassName=com.mysql.jdbc.Driver
    url=jdbc:mysql://localhost:3306/db3?userSSL=false
    

    8.0+版本的连接连接是这样定义的:

    driverClassName=com.mysql.cj.jdbc.Driver
    url=jdbc:mysql://localhost:3306/db3?userSSL=false&serverTimezone=UTC
    

    与Kettle这里预定义的class路径并不一致,那么我们要怎样才能修改这个路径呢?在特征列表里面可以直接修改,但是并没有保存的按钮,修改了也不会生效,有另外一种办法。

    在Kettle设置数据库连接时,不选择MySQL,而选择Generic database的连接类型,如下:

    generic.png

    该连接类型为自定义数据库URL,一看便知,此时和Java定义数据连接时几乎一致,所以填写自定义连接URL,自定义驱动名称即可,这里需要注意的是,8.0+版本的MySQL在连接时需要指定时区,这是上述两个版本的连接url不一致的原因,而class类文件的路径也略有不同,稍作注意即可。

    使用自定义连接,终于在使用8.0+jar包的同时,正确连接到了数据库。

    至此,问题应该算是圆满解决,虽然花了大量的时间,但是遇到问题,就得解决、看透问题。希望能对大家提供一点小小的帮助。

    欢迎访问个人博客www.lemonlzy.cn

    相关文章

      网友评论

        本文标题:Kettle-Pentaho-Data-Integration-

        本文链接:https://www.haomeiwen.com/subject/orreactx.html