摘要:
不多说,直接上干货! 当时啊,因为很多开源项目到最后都成了无人管的项目,为了避免这种情况的发生,要尽快为Kettle项目构建一个社区。这就意味着,在随后的几年可能需要回答上千封的电子邮件和论坛帖子。幸运的是,Kettle很快获得了开源商业智能公司Pentaho的帮助(www.pentabo.com) 阅读全文
posted @ 2017-05-26 09:38
大数据和AI躺过的坑
阅读(1424)
评论(0)
推荐(0)
摘要:
不多说,直接上干货! 大家都知道,这2001年以来,一直在同各种ETL工具做斗争,所以Matt 确定了Kettle的一个主要设计目标是尽可能开放。主要就是指: 开发,可读的元数据格式(XML)。 开放,可读的关系型资源库格式。 开放的API。 容易安装(少于2分钟) 对各类数据库开放 容易使用的图形 阅读全文
posted @ 2017-05-26 09:19
大数据和AI躺过的坑
阅读(972)
评论(0)
推荐(0)
摘要:
不多说,直接上干货! Kettle起源于十年以前,本世纪初。当时啊,ETL工具千姿百态,比较流行的工具有50个左右,ETL框架数量比工具还要多些。 根据这些工具的各自起源和功能可以分为以下4种类型,如图所示: ■ 快速代码修改(Quick Hacks ): 这类工具主要用于抽取数据和加载文本文件。很 阅读全文
posted @ 2017-05-26 09:11
大数据和AI躺过的坑
阅读(1556)
评论(0)
推荐(0)
摘要:
不多说,直接上干货! 在数据仓库领域里,的一个重要概念就是数据整合(data intergration)。数据整合它就是把不同数据库中的数据整合到一起,对外提供统一的数据视图。 数据整合最典型的案例就是整合存货数据和订单数据。数据整合的另一个案例就是把各个部门的客户关系管理系统中的客户信息整合到公司 阅读全文
posted @ 2017-05-26 08:47
大数据和AI躺过的坑
阅读(4061)
评论(0)
推荐(0)
摘要:
不多说,直接上干货! PDI(Kettle) 都能做什么? 可以说凡是有数据整合、转换、迁移的场景都可以使用PDI,他代替了完成数据转换任务的手工编码,降低了开发难度。 同时,我们可以在自己实际业务里,使用它来实现数据的剖析、清洗、校验、抽取、转换和加载等各类常见的ETL类工作。 比如,除了ODS/ 阅读全文
posted @ 2017-05-26 08:40
大数据和AI躺过的坑
阅读(5652)
评论(0)
推荐(0)

浙公网安备 33010602011771号