摘要: 转换机制 每个转换步骤都是ETL数据流里面的一个任务。转换步骤包括输入、处理和输出。输入步骤从外部数据源获取数据,例如文件或者数据库;处理步骤处理数据流,字段计算,流处理等,例如整合或者过滤。输出步骤将数据写会到存储系统里面,例如文件或者数据库。图 1 转换步骤示例1. Step类图简介 Kettle为扩展插件提供了4个扩展点,这4个扩展点也是每个步骤的组成。每个类都有其特定的目的及扮演的角色。以TableInput为例,下图说明了这4个类的继承体系。图 2 StepInterface继承体系 实现StepInterface接口的类,在转换运行时,将是数据实际处理的位置。每个执行线程都表... 阅读全文
posted @ 2013-07-26 10:09 无可奈何SOS 阅读(6168) 评论(5) 推荐(5) 编辑