ETL作用
ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起
抽取(extract)、转换(transform)、加载(load)至目的端的过程
一、 数据的抽取(Extract)
1、对于与存放DW的数据库系统相同的数据源处理方法
2、对于与DW数据库系统不同的数据源的处理方法
3、对于文件类型数据源(.txt,.xls)
4、增量更新的问题
二、数据的清洗转换(Cleaning、Transform)
1、 数据清洗 不完整的数据、错误的数据、重复的数据三大类。
2、 数据转换 不一致的数据转换、数据粒度的转换,以及一些商务规则的计算
                    
                
                
            
        
浙公网安备 33010602011771号