BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈

简介

最近公司业务需要用到BI SSIS来处理商业智能和大数据,网上大多数是以前版本介绍,没有最新版,响应公司需要,现现学现卖总结一下入门及调试技巧,随便附加常用技术栈。SSIS是什么?“SSIS是Microsoft SQL Server Integration Services的简称,是生成高性能数据集成解决方案(包括数据仓库的提取、转换和加载 (ETL) 包)的平台。
”SQL Server Integration Services (SSIS) 提供一系列支持业务应用程序开发的内置任务、容器、转换和数据适配器。您无需编写一行代码,就可以创建 SSIS 解决方案来使用 ETL 和商业智能解决复杂的业务问题,管理 SQL Server 数据库以及在 SQL Server 实例之间复制 SQL Server 对象。

1.1 入门

新建,微软Visual Studio 最近版本新建就不用多说了,如图;
image.png

2 ,SSIS控件

2.1,Variables

(1) 参数设置,在Package设计页面空白处“右键”选择Variables,点击image.png添加参数

image.png

(2)Expression设置,点击image.png

配置带函数的参数,选择所需要的参数直接拖动即可

image.png

2.2,设置数据连接

(1)在Connection Managers窗口中“右键”创建各种Connection
image.png

(2)配置带参数的数据连接,选中创建的Connection后选择Properties窗口中

Expressions配置连接参数,参数配置同上

image.png

2.3,Sequence Container

容器控件,用来将相似的tasks分组,一般用来将所有维度表和事实表处理分开

image.png

2.4,Execute SQL Task

image.png

执行SQL任务

image.png

(1)选中控件,选择Edit

image.png

SQL Statement栏中配置ConnectionType(数据库类型),Connection(数据库),SQLSourceType

SQLSourceType有三种类型:

  • Direct input  ,直接在SQLStatement中输入SQL语句,若需要参数请用“?”代替

  • File connection,File类型连接

  • Variable,从我们配置的Variables中选择

(2)配置SQL语句中需要的参数“?”,选中Parameter Mapping

image.png

2.5,Script Task

image.png

执行C#代码脚本任务,并返回成功或失败,

(1)选中,右键Edit
image.png

选择ReadOnlyVariables,配置需要传入C#代码的参数

image.png

(2)编辑C#代码,image.png进入代码编辑界面

2.6,Data Flow Task

image.png

数据流任务控件,在其编辑中可放入对数据操作的SSIS控件,

2.7,Excel Source Plus

image.png

将Excel数据源导入数据库,在其Edit界面编辑需要导入的Excel数据源,点击[图片上传失败...(image-2c445-1524627024788)]

添加新的数据源
image.png

2.8,Conditional Split

image.png

可以根据设置的条件函数处理数据,如对数据进行过滤、合并。在其Edit界面,

  • Order条件执行顺序,可上下调节

  • Output Name 输出名

  • Condition配置数据处理条件

image.png

2.9,OLE DB Source

image.png

OLEDB类型数据源,在其Edit界面配置数据源

image.png

New添加新数据库,Data access mode选择数据源获取方式,直接选取或者从Variables参数中选取,或者通过SQL语句获取,若SQL语句需要参数点击image.png

配置
image.png

2.10,Derived Column

image.png

向要导入的数据库表中派生列,其Edit界面

image.png

  • Derived Column Name 派生新列的字段名

  • Derived Column 派生列的方式

  • Expression  新列字段值的表达式

2.11,Lookup Plus

image.png

将其他数据库表中的字段值插入数据中,其Edit界面

image.png

Input Column 数据中要插入数据的字段名

Reference 需要引用的数据,双击后进入其Edit界面

image.png

首先编辑其需要引用数据的数据库,选择数据库Table/View作为数据源或者通过SQL语句查询数据,Key Column为两表关联字段,Value Column为要插入的数据字段

2.12,Data Conversion

image.png

数据转换,将数据类型转换为MSSQL的数据类型,在其Edit界面选择需要转换的字段即可

image.png

2.13,Row Count – Source

image.png

数据统计,统计处理的数据量,需要在Variables中定义Int32数据类型的参数来接受统计值

image.png

2.14,OLE DB Destination

image.png

OLE DB目标,数据导入的目标,其Edit界面

image.png

配置好需要导入数据的数据库与数据表,若出现image.png

错误,请点击Mapping仔细检查数据字段匹配是否正确

image.png

3.0调试

3.1 第一种调试方法

image.png
如图,再箭头上直接右键 选中Enable Data Viewer,这样运行到这里会停止,并且能看到详细数据情况如下图,点击继续往下走。
image.png

3.2 第二种调试方法

image.png
如图,在package执行时,会出现一个progress显示执行的进度

3.3第三种调试方法

image.png

image.png
选中Execute SQL Task,点击右键,选中Edit Breakpoint来设置断点,进行调试。运行到这里会断点

3.4第四种调试方法

image.png

package 事件调试,可以在事件选中指定事件,当错误出现时,发送runtime的错误信息或将错误信息写入文档,方便捉错误信息。

4.0 其他

注意,下面部分来自网上

Control Flow 控制流程

Containers 容器

Core Task 核心任务

Other Task 其他任务

Data Flow 数据流程

Transforms 传输

Sources 数据源

Destination 目标

SSIS 错误和消息参考

SSIS 错误和消息参考:https://msdn.microsoft.com/library/ms345164(v=sql.105)

posted @ 2018-04-25 14:10  云衢  阅读(2732)  评论(2编辑  收藏  举报
levels of contents --------------------------------------------------------------------------------------------------------