ETL作用

ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起

抽取(extract)、转换(transform)、加载(load)至目的端的过程

一、 数据的抽取(Extract)

 

1、对于与存放DW的数据库系统相同的数据源处理方法

2、对于与DW数据库系统不同的数据源的处理方法

3、对于文件类型数据源(.txt,.xls)

 

4、增量更新的问题

二、数据的清洗转换(Cleaning、Transform)

 

1、 数据清洗   不完整的数据、错误的数据、重复的数据三大类。

2、 数据转换  不一致的数据转换、数据粒度的转换,以及一些商务规则的计算

 

来源 https://www.cnblogs.com/yjd_hycf_space/p/7772722.html

posted @ 2020-09-04 15:12  小小小波  阅读(882)  评论(0)    收藏  举报