代码改变世界

随笔档案-2013年5月16日

pentaho DI--- Tutorial (spoon)

2013-05-16 20:16 by 很大很老实, 810 阅读, 收藏,
摘要: Pentaho Data Integration (PDI, also called Kettle),是pentaho的etl工具.虽然etl工具一般都用在数据仓库环境中,可是,PDI还是可以做以下事情:1)在数据库或应用系统间迁移数据.2)把数据导成为检系统3)大数据的批量倒入数据库。4)系统整合。5)数据清洗。PDI的使用非常简单,每一步基本上都可以听过图形化的工具来完成,而不需要写代码。从这个意义上说,PDI是面向元数据的。PDI既可以作为一个单独工具使用,也可以作为pentaho的整个软件包的一部分使用。作为一个单独的工具,PDI支持各种数据源的输入和输出,包括:文本文件;数据表;各种 阅读全文

pentaho DI---Get Started (spoon)

2013-05-16 18:57 by 很大很老实, 262 阅读, 收藏,
摘要: 对任何人来说,学习一个新的工具,都是有点畏难情绪的.而pentaho的ETL工具,是我作为重点学习的工具,那就克服困难把.今天学习英文资料的:get started.连接是:http://wiki.pentaho.com/display/EAI/Getting+Started.首先,给出连接:http://infocenter.pentaho.com/help/index.jsp?topic=%2Fgetting_started_with_pdi%2Ftopic_introduction.html.介绍最新版本的etl工具.其次,提供了一些flash demo,不过,没声音.再给出一些有用的连 阅读全文