zourui4271

博客园 首页 新随笔 联系 订阅 管理

2016年1月22日 #

摘要: 要进入开发阶段,了解不同的ETL产品。整个ETL系统中,时间或更精确的,吞吐量是主要关心的内容。这种转换处理任务设计的主要目的归根结底是使得数据装载到展现表中最快并使得最终用户能快速的从这些表中得到响应。推或者拉:推,是源系统主动把文件推向ETL服务器,拉是ETL服务器主动从文件服务器上抽取文件。无... 阅读全文
posted @ 2016-01-22 16:54 zourui4271 阅读(951) 评论(0) 推荐(0)

摘要: 装载数据仓库过程中,不管作业是实时执行还是批处理方式执行,其调度时间,执行顺序和执行环境都是关键点。本章描述创建一个ETL操作策略,来保证数据仓库的数据即时可用。ETL执行策略分为两种:1 调度 2 支持(为了确保etl过程运行完成,数据仓库必须能够被监控活动情况,并且必须有人专门支持)调度工具:任... 阅读全文
posted @ 2016-01-22 16:46 zourui4271 阅读(799) 评论(0) 推荐(0)