最近学习了kettle的一些基本应用,有些感慨,也有些心得,因此想记下来。
刚开始学习kettle的时候,虽然手上有很多的文档资料,但由于以前一直没有接触过相关内容,而这次又因为是为了学习这个软件而学习,因此刚开始完全没有头绪。其实这些软件对绝大多数使用者来说,都是半知半解的,因为软件只是一个工具,身为使用者,能用它达成自己的目的就算成功了,至于其他功能,用到时再看就行了,可惜,当时没想到这点,对各种功能都去试试,结果连最基础的功能都没学会。
后来在前辈的指点之下,本人如同醍醐灌顶,抛去华而不实的招式,苦练基本功---基础的表与表,表与文本与Excel表之间的导入导出,经此一役,本人总算真正开始学习kettle。
表与表之间的导入是最简单的,设置好源库与目标库之后基本就可以了,这里有一点说明:无论输入是什么,在表输出时,都要保证输出的表是存在的,而且表的字段必须包括输入的所有字段,否则会报错,这点我在前期不清楚,因此出现了很多错。
文本和Excel做输入时,其内部数据格式必须与输出相同,否则报错,还有,不要忘了获取字段,如果忘了会报错,而且这一步还可以检验输入是否有问题。
除去导入导出这些基础操作,kettle主要的功能是数据清理,跨上这四个基础台阶后,我的下一步是字段修改,功能是将文本内的姓名字段(英文)全变为大写,电话字段全部加上86(线判断是否已经存在86)。这个算是一个小进阶。
我也才开始学习,不过我觉得这几步学习还是比较科学的。
网友评论