kettle学习笔记
一、简介:
由纯Java编写,可在Windows、Linux、Unix环境运行,纯绿色无需安装的一款ETL工具。
补充:
企业数据仓库模型:
一、数据来源:
1、历史数据;
2、正在运行的业务系统数据,例如:OA、CRM
3、日志、三方数据等其他来源的数据。
二、ETL进入数据库:
ETL(Extract-Transform-Load)即数据的抽取-转换-装载过程。
三、建模(维度建模),有雪花、星型模型,一般多为星型建模:
1、维度表;
2、事实表。
四、数据汇总到数据集市
五、数据分析(接口定义),可用于:
1、报表;
2、OLAP;
3、数据挖掘;
4、商务模型。
六、企业门户网站调用接口:
对数据进行访问,产生数据价值。
浙公网安备 33010602011771号