http://msdn.microsoft.com/zh-cn/library/ms169917.aspx

 

教程:创建简单的 ETL 包

 

Microsoft Microsoft Integration Services 是一个可以生成高性能数据集成解决方案(包括为数据仓库提取、转换和加载 (ETL) 包)的平台。 Integration Services 包括用于生成和调式包的图形工具和向导;用于执行工作流函数(如 FTP 操作)、执行 SQL 语句以及发送电子邮件的任务;用于提取和加载数据的数据源和目标;用于清除、聚合、合并和复制数据的转换;用于管理包执行和存储的管理服务,即 Integration Services;以及用于 Integration Services 对象模型编程的应用程序编程接口 (API)。

在本教程中,您将学习如何使用 SSIS 设计器创建一个简单的 Microsoft SQL Server Integration Services 包。所创建的包将从平面文件提取数据,重新设置数据的格式,然后将已重新设置格式的数据插入到事实数据表中。在下列课程中,将扩展包以阐释循环、包配置、日志记录和错误流。

在安装教程所用的示例数据的同时,也会安装将在教程的每一课中创建的完整的包版本。使用完整的包,您可以按需要跳过前面几课而从后面的课程开始学习教程。如果您是第一次使用包或新的开发环境,我们建议从第 1 课开始学习。

学习内容

熟悉 Microsoft SQL Server Integration Services 的新工具、控件和功能的最好方法,就是使用它们。本教程将引导您使用 SSIS 设计器创建一个简单的 ETL 包,其中包含循环、配置、错误流逻辑和日志记录。

要求

本教程适用于熟悉基本数据库操作,但对 SQL Server Integration Services 中的新功能认识有限的用户。

若要使用本教程,系统中必须安装有下列各项:

  • 带有 AdventureWorksDW 数据库的 SQL Server。为了增强安全性,默认情况下不会安装示例数据库。若要安装示例数据库,请参阅安装 SQL Server 示例和示例数据库的注意事项
  • 本教程还需要示例数据。示例数据与示例一起安装。如果无法找到示例数据,请返回以上过程,按说明完成安装。
ms169917.note(zh-cn,SQL.105).gif注意:
阅读教程时,建议将“下一个主题”“上一个主题”按钮添加到文档查看器工具栏中。有关详细信息,请参阅向帮助中添加“上一步”和“下一步”按钮

本教程假定没有将 SSIS 设计器重新配置为使用控制流元素或数据流元素的自动连接功能。如果 SSIS 设计器使用自动连接功能,则元素可能会在添加到设计图面时自动进行连接。控制流的自动连接功能还支持将“失败”“完成”,而不是将“成功”用作默认的约束。如果 SSIS 设计器未使用“成功”作为默认的约束,则应当在执行教程时重置此配置。可以在“选项”对话框的“商业智能设计器”部分中配置自动连接功能,该对话框可通过单击“工具”菜单中的“选项”获得。

本教程中的课程

第 1 课:创建项目和基本包

在本课中,将创建一个简单的 ETL 包,从单个平面文件中提取数据,再使用查找转换转换数据,最后将所得结果加载到目标事实数据表中。

第 2 课:添加循环

在本课中,将扩展第 1 课中创建的包,利用新增的循环功能,将多个平面文件提取到单个数据流进程中。

第 3 课:添加包配置

在本课中,将扩展第 2 课中创建的包,利用新增的包配置选项。

第 4 课:添加日志记录

在本课中,将扩展第 3 课中创建的包,利用新增的日志记录功能。

第 5 课:添加错误流重定向

在本课中,将扩展第 4 课中创建的包,利用新增的错误输出配置。