jnkk

导航

 

     ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据, ETL是BI(商业智能)项目重要的一个环节。

 

一.什么是kettle
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。

中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。

二.kettle的四种产品

 Chef(中文:厨师)、Kitchen(中文:厨房)、Spoon(中文:勺子)、Pan(中文:平底锅)---注意英文发

    Chef—工作(job)设计工具 (GUI方式)

    Kitchen—工作(job)执行器 (命令行方式)

    Spoon—转换(transform)设计工具 (GUI方式)

    Span—转换(transform)执行器 (命令行方式)

三、简单的来说,就是将不同的数据来源(网页,数据库,excel)统一 抽取,转化,存储到达需要的格式

比如我的需求是将 不同数据库的数据,同步到另一个数据库中,

job 与定时任务


原文链接:https://blog.csdn.net/weixin_42369687/article/details/101712922

posted on 2022-03-31 00:09  jnkk  阅读(196)  评论(0)    收藏  举报