<!-正在加载刚性遮罩-> < div id =' loading ' >

kettle使用教程

kettle使用教程

​ ETL(Extract-Transform-Load的缩写,即数据删除,转换,装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种水壶是纯Java编写,支持图形化的GUI设计界面,然后可以以工作流的形式流转,在做一些简单或复杂的数据抽取,质量检测,数据清洗,数据转换,数据过滤等方面具有比较稳定的表现,其中最主要的我们通过熟练的应用它,减少了非常多的研发工作量,提高了我们的工作效率。

1. kettle概念

Kettle是一个国外开源的ETL工具,纯java编写,可以在Window,Linux,Unix上运行,绿色无需安装,数据移除高效稳定。

Kettle中文名称叫水壶,该项目的主程序员MATT希望把各种数据放到一个壶里,然后以一种指定的格式替换。

Kettle这个ETL工具集,它允许您管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。

Kettle中有两种脚本文件,转换和作业,转换完成针对数据的基础转换,job则完成整个工作流的控制。

2. 下载安装

2.1 下载: 下载地址:https://sourceforge.net/projects/pentaho/files/Data%20Integration/
2.2 安装: kettleKettle是纯JAVA编程的开源软件,需要安装jdk及本地环境变量配置。
kettle无需安装,直接解压zip文件到指定的文件夹。在Lunix操作系统上,需要执行以下脚本:
cd Kettle
chmod +x *.sh

2.3需准备的其他东西:
数据库驱动,如笔者连接的是mysql则需将mysql的驱动放在kettle根目录的bin下面,然后到服务中启动mysql,重启kettle。

3. 教程步骤

3.1 kettle中的一个图形用户界面叫spoon,spoon可以设计和运行转换和作业。在windows中执行spoon.bat,在Lunix系统中执行spoon.sh;运行spoon.bat,打开spoon图形工具

打开后界面

3.2 建立转换 文件>新建转换

新建转换后在左边的主对象树中建立DB连接用以连接数据库。如图所示:

img

把相对应的值都填好-点击测试:

如果出现下面的情况,那是因为你没有对应的数据库链接驱动,请下载对应驱动后,放入kettle的lib文件夹。:

3.3 数据表插入\更新

(1)新建表插入

在左边的面板中选择“核心对象”,在核心对象里面选择“输入->表输入”,用鼠标拖动到右边面板。如图所示:

img

双击拖过来的表,可以编辑表输入。选择数据库连接和编辑sql语句,在这一步可以点击预览,查看自己是否连接正确。

img

(2)通过插入\更新输出到表。在左边面板中选择核心对象、选择“输出->插入\更新”如图所示:

img

编辑插入更新:
  首先:表输入连接插入更新。
  选中表输入,按住shift键,拖向插入更新。

img

然后:双击插入更新,编辑它。

img

到这里基本上,这个转换就要做完了,可以点击运行查看效果,看是否有误,这个要先保存了才能运行,可以随意保存到任何一个地方。

(3)建立作业

使用作业可以定时或周期性的执行转换,新建一个作业。并从左边面板拖入start 和转换。

img

双击start可以编辑,可以设置执行时间等等

img

点开装换,可以设置需要执行的转换任务,比如可以执行上面我们做的转换,XXX.ktr

img

最后点击运行即可。到这里,一个简单的通过作业调度的kettle就算做完了。

posted @ 2020-10-15 16:05  xrg  阅读(6550)  评论(2编辑  收藏  举报