• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录

cynchanpin

  • 博客园
  • 联系
  • 订阅
  • 管理

View Post

kettle新手教程



1、kettle介绍

      kettle是一个ETL(Extract, Transform and Load抽取、转换、加载)工具,ETL工具在数据仓库项目使用很频繁,kettle也能够应用在下面一些场景:

    • 在不同应用或数据库之间整合数据

    • 把数据库中的数据导出到文本文件

    • 大批量数据装加载数据库

    • 数据清洗

    • 集成应用相关项目是个使用

kettle使用很easy,通过图形界面设计实现做什么业务,无需写代码去实现。因此,kettle是以面向元数据来设计。

kettle支持非常多种输入和输出格式。包含文本文件。数据表。以及商业和免费的数据库引擎。另外,kettle强大的转换功能让您非常方便操纵数据。

以下展示一个简单的“Hello World”演示样例,本教程将告诉你怎样轻松用kettle工作。让你有基础可以学习更复杂的转换功能。

  • 安装kettle

  • kettle设计工具spoon介绍

  • hello world演示样例

  • 又一次设计helloworld演示样例

 

2、入门演示样例学习

2.1、安装kettle

首先通过官网下载kettle;

需求环境:

kettle须要jre1.5及以上版本号。能够通过oracle官网免费下载;

kettle安装

kettle无需安装。直接解压zip文件到指定的目录。在类unix操作系统上。须要运行下面脚本:

cd Kettle

chmod +x *.sh

 

执行

kettle中的一个图形用户界面叫spoon,spoon能够设计转换和作业,也能够执行转换和作业,以下的内容将继续介绍他们。

 

2.2、kettle设计工具spoon介绍

Spoon是一个图形设计工具,用来设计和測试数据交换处理流程,也能够通过命令行(终端)运行处理流程。


资源库和文件

在spoon中设计作业和转换。kettle提供两种方式存储:资源库和文件;

假设你选择资源库,spoon第一次启动时须要创建资源库。选择文件方法,作业保存文件是的扩展名是KJB。转换文件的扩展名为KTR,为了简化学习,以下教程採用后者。

 

启动spoon

在windows中运行spoon.bat,在类unix系统中运行spoon.sh;启动时首先出现一个对话框窗体提示选择资源库及输入连接信息,点击取消button。

然后能够看到欢迎窗体,点击“工具”菜单下的“选项”。弹出窗体中能够进行一些全局设置,如语言、日志等信息,设置后需重新启动才干生效。


 

以下内容參见《kettle Hello World教程》

2.3、hello world 演示样例

2.4、又一次设计hello world 演示样例





posted on 2017-04-27 12:01  cynchanpin  阅读(12328)  评论(0)    收藏  举报

刷新页面返回顶部
 
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3