美文网首页数据仓库kettle使用数据仓库
Kettle入门之二 Kettle应用场景(只增量插入)

Kettle入门之二 Kettle应用场景(只增量插入)

作者: 开心跳蚤 | 来源:发表于2017-12-08 15:50 被阅读502次

    【数据整合】Kettle 应用之一 介绍、安装中我们已经介绍了如何安装Kettle工具。现在我们开始使用Kettle。

    Kettle应用场景

    在此,我们主要对示例1进行说明。

    为方便演示,我们在数据库A和数据库B中分别创建表userA和表userB。最终目标为将数据表userA中的数据插入到数据表userB中。

    create database testA;
    use testA;
    create table `userA`(
        `id`int(10) primary key,
        `name` varchar(50),
        `age` int(3)
    )ENGINE=InnoDB DEFAULT CHARSET=utf8;
    insert into userA values(1,'张三',20);
    insert into userA values(2,'李四',21);
    insert into userA values(3,'王五',22);
    
    create database testB;
    use testB;
    create table `userB`(
        `idB`int(10) primary key,
        `nameB` varchar(50),
        `ageB` int(3)
    )ENGINE=InnoDB DEFAULT CHARSET=utf8;
    

    操作步骤

    1、运行软件,进入主界面。点击左上角的 文件 → 新建 → 转换新建一个转换,并保存,转换的后缀名为ktr。

    2、点击面板左侧的 主对象树 ,选择 DB连接 右键,选择 新建新建数据库连接向导 分别创建对数据库A和数据库B的连接。

    选择“新建”选项的操作视图 选择“新建数据库连接向导”选项的操作视图 1 选择“新建数据库连接向导”选项的操作视图 2 选择“新建数据库连接向导”选项的操作视图 3

    注意: 如果在点击测试连接时出现下图所示错误,检查我们的安装目录下的lib中是否有对应数据库连接的jar包文件(如mysql的jar文件:mysql-connector-java-5.1.6-bin.jar),下载对应的jar,放到lib文件夹下,重启kettle软件,即可。

    3、点击面板左侧的 核心对象 ,选择 输入文件夹下的 表输入 并把它拖到右侧的编辑区中。

    4、双击编辑区的“表输入”图标,编辑数据输入源。

    5、点击面板左侧的 核心对象 ,选择 转换文件夹下的 字段选择 并把它拖到右侧的编辑区中。

    6、按住 shift 同时鼠标从 “testA表输入”到“字段选择”画一条连接线。

    7、双击编辑区的“字段选择”,选择“元数据”面板,点击右侧“获取改变的字段”,将自动列出输入表中所有字段。根据要抽取的目标表中的字段名,给每一个输入字段修改为对应的输出字段。
    注意:此时必须在Encoding栏中选择输出库的编码格式

    image.png

    8、点击面板左侧的 核心对象 ,选择 输出文件夹下的 表输出 并把它拖到右侧的编辑区中,按住 shift 划线连接 “字段选择”。

    9、双击编辑区的“表输出”图标,编辑数据输出目标。

    10、然后勾选 指定数据库字段 ,选择 数据库字段 ,点击 输入字段映射,映射输入输出关系。

    注意:如果在点击 输入字段映射 时,提示如下错误:

    检查我们的数据库驱动jar包版本 mysql-connector-java-5.1.6-bin.jar , 因为测试数据库版本为 MySQL 6.3 , 而使用此版本的数据库驱动包,会在创建数据库连接的时候发送测试语句 SET OPTION SQL_SELECT_LIMIT=DEFAULT , 但是5.6及以后的版本都不再支持SET...,此时,我们只需要将驱动版本升级,只需要将数据库驱动版本修改为5.1.22以上即可。

    11、因为我们在“字段选择”中修改了每个输入字段对应的输出字段的名称,此处,我们点击 猜一猜 ,将会自动根据字段近似度自动匹配映射关系。

    12、到这里,我们最简单的一个提取数据的转换已经建立完成了,点击“校验这个转换”,Kettle会校验并给出简单的报告。没有任何问题。

    13、点击“运行这个转换”,选择“本地执行”,点击“启动”来执行这个转换。

    14、转换成功后,我们可以在控制台中看到如下信息。检查本地数据库,数据库A的userA表中的数据已经全部被导入到了数据库B的userB表中。

    注:此示例只适用于目标表为空,或者目标表与源表没有主键冲突的情况

    image.png

    上一篇: Kettle入门之一 介绍、安装
    下一篇: Kettle入门之三 Kettle定时任务(GUI)

    相关文章

      网友评论

      • 3be0002f2d9c:楼主写的很好,完全看懂+吸收,刚刚就真的转了100000+条数据,差点带崩数据库(sql server不想mysql,不能用limit的,玩大了。。。),然后被叼了,哈哈哈哈

      本文标题:Kettle入门之二 Kettle应用场景(只增量插入)

      本文链接:https://www.haomeiwen.com/subject/fzdlixtx.html