目录:
Informatica基础系列(一)——Helloworld
Informatica基础系列(三)——表达式、筛选、查找组件
正文:
Informatica PowerCenter,简称 Infa,是一款非常强大的ETL工具,支持各种数据源之间的数据抽取、转换、加载等数据传输,多用于大数据和商业智能等领域。一般应用企业根据自己的业务数据构建数据仓库,通过 Infa 在业务数据和数据仓库间进行 ETL 操作。其中 E(Extract)指数据抽取,T(Transform)指数据转换,L(Load)指数据加载。在挖掘到的这些零碎无规律的原始数据的基础上,进行维度的数据分析,找到用户的习惯和需求,以指导业务拓展及战略转移的方向。
这个系列是一个 Infa 基础入门的介绍,包括导入数据源表/目标表、开发 Mapping 与 Workflow、Workflow 定时运行计划、监控工作流的运行状况、变量与参数、内置函数、环境数据的导入导出(比如从 Trial 环境迁移到 Product)、Infa的备份与恢复等。
Mapping 的开发一般会占据很大的时间比例,它主要负责从数据源表(Source)到目标表(Target)之间的数据转换,利用它的各种组件能够做很多工作,来满足各种转换的需求。 这些组件包括更新策略组件(UPDTRANS)、表达式组件(EXPTRANS)、过滤器组件(FILTRANS)、查找组件(LOOKUP)、联合组件(JNRTANS)、路由组件(RTRTRANS)等。除此之外,还可以开发可重用的Transformation 和 Maplet,避免重复性工作。
Informatica 的内容很多,功能也十分强大,以后的文章会详细介绍,基本会围绕以上的内容分享,敬请期待!
At 2017.08.01
网友评论