什么是KETTLE
Kettle 的主作者是 Matt ,他在 2003 年就开始了这个项目,在 PDI 的代码里就可以看到最早的日期大概在2003年4月。 从版本2.2开始, Kettle 项目进入了开源领域,并遵守 LGPL 协议。
在 2006年 Kettle 加入了开源的 BI 组织 Pentaho, 正式命名为PDI, 加入Pentaho 后Kettle 的发展越来越快了,并有越来越多的人开始关注它了。
PDI(Kettle) 是什么?
PDI(Kettle) 是一款开源的、元数据驱动的 ETL (数据的抽取、转换、加载)工具,是开源 ETL 工具里功能比较强大的一个。
PDI 的全称是Pentaho Data Integeration,Kettle 是 PDI 以前的名称,Kettle 本意是水壶的意思,表达了数据流的含义。
PDI(Kettle) 都能做什么?
可以说凡是有数据整合、转换、迁移的场景都可以使用PDI,他代替了完成数据转换任务的手工编码,降低了开发难度。
案例一:导入Mysql数据到MongoDB数据库中

-
选择Mysql输入,配置数据库连接,并编写查询sql,通过预览进行验证数据是否符合要求
选择Mysql输入
-
选择MongoDB OutPut,配置MongoDB连接,
选择MongoDB
-
配置数据库,集合,单次执行行数,和每次执行的策略
配置数据库
-
配置具体字段,读入字段名,导出MongoDB字段名,以及其他配置
配置字段
-
-
关联输入和输出,通过悬停在对象上,会弹出选择按钮,拖拽至输入对象,即可关联
关联输入输出
-
保存为ktr文件,并点击播放,进行转换,查看执行结果
网友评论