Kettle安装及配置

官网:https://www.hitachivantara.com/en-us/products/dataops-software/data-integration-analytics/pentaho-community-edition.html

安装环境说明

jdk 采用 jdk-8u102-windows-x64
kettle采用kettle 8.2
文末,博主会将kettle下载地址附上,还包含其他版本(作为本专栏开博小福利)。kettle9.0版本以下,本教程都适用,kettle9.0及更新的其他版本,博主暂未测试。若有小伙伴测试过,可以留言告知博主。

文章目录
一、Kettle介绍
1、kettle是什么
2、kettle产品
二、安装步骤
1.安装jdk及配置环境变量
 安装jdk
 配置环境变量
2.安装kettle
踩过的坑
一、Kettle介绍
1、kettle是什么
  Kettle是一款国外开源的ETL工具,纯java编写,由于java具有跨平台的特性,故Kettle可以在Windows、Linux、Unix上运行,数据抽取高效稳定。
  Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。
  Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

2、kettle产品
  Kettle目前包括4个产品:Spoon、Pan、CHEF、Kitchen。
  SPOON: 允许你通过图形界面来设计ETL转换过程(Transformation)。
  PAN: 允许你批量运行由Spoon设计的ETL转换 (例如使用一个时间调度器)。Pan是一个后台执行的程序,没有图形界面。
  CHEF: 允许你创建任务(Job)。 任务通过允许每个转换,任务,脚本等等,更有利于自动化更新数据仓库的复杂工作。任务通过允许每个转换,任务,脚本等等。任务将会被检查,看看是否正确地运行了。
  KITCHEN: 允许你批量使用由Chef设计的任务 (例如使用一个时间调度器)。KITCHEN也是一个后台运行的程序。

kettle目录文件
classe:生命周期监听,注册扩展、日志的配置文件
Data integration app:数据集成应用
Data Server JDBC Driver :jdbc驱动程序的数据服务
docs : docs 文档
launcher : kettle的启动服务
lib:支持库jar包
libswt:kettle图像库jar
plugins:plugins 插件
pwd: kettle 集群配置文件
simples: 自带例子
simple-jndi:连接配置
system:系统目录
ui:软件界面
carte.bat/Carte.sh 启动集群命令
Encr.bat/Encr.sh  kettle提供的加密算法
import.bat/import.sh 导入命令
kitchen.bat/kitchen.sh 运行job的命令

pan.bat/pan.sh 运行转换的命令
set-pentaho-env.bat 设置环境变量的脚本

Spoon.bat 启动kettle UI 界面
SpoonDEbug.bat  以debug的方法是运行kettle

https://blog.51cto.com/u_14883682/4583652

注:本专栏主要介绍Spoon。

二、安装步骤
1.安装jdk及配置环境变量
 安装jdk
  jdk的安装比较简单,直接下一步就可以了。但是如果需要修改存储路径,则在如下图中所示的步骤中选择安装路径,然后再点击下一步即可。


 配置环境变量
  右击“此电脑”–属性–高级系统设置-环境变量,在弹出的环境变量页面选择新建系统变量,在新增页面输入变量名和变量值,变量名可根据自己的习惯填写,变量值即为上一步存储的jdk的位置。


  在系统变量中找到Path,选中Path,点击“编辑”,在弹出的编辑环境变量页面点击“新建”,输入:%JDK_HOME%\bin;。这里的“JDK_HOME"即为上一步输入的变量名。


  在dos窗口输入java -version,出现如下信息,即为安装成功。

  目前暂未遇到安装失败的情况。

2.安装kettle
  Kettle的安装比较简单,下载Kettle安装,直接解压即可。然后启动Spoon.bat。如下图。


踩过的坑
1、运行Spoon.bat,出现闪退,先检查自己的jdk版本问题,若jdk版本无问题,则通过文本打开Spoon.bat修改内存。
2、运行Spoon.bat,提示A Java Exception has occurred,也是jdk版本问题。
3、启动页右上角无“Connect”按钮,jdk版本过高,降低jdk至1.8即可。
4、连接MySQL数据库,提示 Driver class 'org.gjt.mm.mysql.Driver' could not be found, make sure the 'MySQL' driver (jar file) ,下载mysql ,放到kettle安装目录的lib文件下(即data-integration/lib)。mysql包在下面链接中。
kettle版本下载地址:(本链接会持续更新)
链接:链接:https://pan.baidu.com/s/1GMDguJI7enZTI69nYa3Hyg
提取码:v0jc
原文链接:https://blog.csdn.net/qq_36222108/article/details/109670508

 

下载:https://sourceforge.net/projects/pentaho/files/

8.2以下镜像版本下载https://mirrors.bit.edu.cn/pentaho/

 

 

linux 安装:https://blog.csdn.net/zzq900503/article/details/79110810

posted @ 2023-05-18 10:34  星云惊蛰  阅读(318)  评论(0)    收藏  举报