摘要: 在上一个随笔中我们处理了一个010305c.dat文件,如果在一个文件夹中有多个dat文件应该怎么办呢? 这里就需要使用Foreach Loop container任务来循环处理文件,这个需要使用多个dat文件。 循环首选对路径C:\SSISDemos下的所有.DAT文件进行循环操作并下载到数据库中。使用Foreach Loop循环执行操作。这里还在上随笔的Package里拖放一个Foreach Loop Container,重命名为Loop Through Files。双击打开边界界面,点击打开Collection标签界面,可以看到Enumerator栏内默认选择Foreach File E 阅读全文
posted @ 2011-04-25 19:37 nd 阅读(4150) 评论(3) 推荐(2)
摘要: 前面我们熟悉了很多ELT任务,这一个节来讨论复杂点的数据清洗。这里我们要使用的数据源是.dat文件,这种文件在大型主机上,或者是比较老旧的应用系统中非常常见。这个例子的情景是一个信用卡公司,目前正着手于拓展Florida州新成立的一些公司的业务。市场部门每周都会向这些公司发送一些邮件,我们要为所有的邮件准备抽取数据。假设Florida州提供的一个上面这个dat文件,它是从老的计算机系统里面得到的,它是定长分隔的,这意味着文件中没有分隔符,必须手工设置分隔列的长度。从下面的连接下载这个.dat文件:010305c.dat。如果使用工具查看,它们的模样类似下面的: 01 ANNUAL_MICRO_ 阅读全文
posted @ 2011-04-22 12:59 nd 阅读(9388) 评论(3) 推荐(2)
摘要: 2011-04-20 修改机器登录密码后不能登录SQL Server今天发现一个很有趣的现象。公司的电脑每两个月就会提示重置登录密码,今天我修改了密码登录进去发现不能登录SQL Server了,我的是2008版本的 。这就奇了个怪了,以前也改过好几次密码的啊, 今个怎么就不行了。后来在老员工的提示之下,原来需要重新设置SQL Server的所有service的密码。如图。打开service,右击SQL Server(SQLEXPRESS),点击Log On标签,修改密码。然后再次登录,这回就可以了。如果还有其他的SQL Server对象不能登录,也要修改相应的service。 2011-9-. 阅读全文
posted @ 2011-04-20 22:29 nd 阅读(3400) 评论(15) 推荐(5)
摘要: 今天偶尔看到sql中也有with关键字,好歹也写了几年的sql语句,居然第一次接触,无知啊。看了一位博主的文章,自己添加了一些内容,做了简单的总结,这个语句还是第一次见到,学习了。我从简单到复杂地写,希望高手们不要见笑。下面的sql语句设计到三个表,表的内容我用txt文件复制进去,这里不妨使用上一个随笔介绍的建立端到端的package的方法将这些表导入到数据库中,具体的就不说了。从这里下载文件employees.txt,customers.txt,orders.txt参考文章:http://www.cnblogs.com/wwan/archive/2011/02/24/1964279.html 阅读全文
posted @ 2011-04-18 21:35 nd 阅读(19168) 评论(19) 推荐(0)
摘要: 通过基本task和transforms的学习,现在可以转入到SSIS实际应用。建立端到端的package这个系列中首先讲解将一系列的文件数据导入到SQL Server中的方法,然后添加一些复杂转换,最后将看到如何在package中处理错误和动态地创建package。 创建一个项目使用SSIS的首要目的是从数据源中读取数据,然后写入Destination中,这个向导介绍从平面文件中读取数据。使用下面的文字Zipcode State ZipName32008 FL BRANFORD32009 FL BRYCEVILLE32011 FL CALLAHAN32013 FL DAY32033 FL EL 阅读全文
posted @ 2011-04-17 12:41 nd 阅读(6689) 评论(2) 推荐(0)
摘要: 数据视图是SSIS中常见的调试工具,它的功能是在包运行的时候查看数据。例如如果在Aggregate转换的前,后分别放置一个数据视图,尅查看数据在进行聚合操作之前和之后的数据。 但是如果将package部署或者作为job的一个步骤运行,数据视图将不会显示出来。有四种类型的数据视图。表格Grid:在一个时间点显示数据快照直方图Histogram:使用柱状图显示数据的分布散布图Scatter Plot:使用二维分布图显示数据分布柱状图Column Chart:使用柱状图显示数据分布右击绿色连线选择Data Viewers,打开编辑数据界面,如图4-39,选择数据视图的类型并重命名。在Metadata 阅读全文
posted @ 2011-04-14 20:07 nd 阅读(2864) 评论(0) 推荐(2)
摘要: 在上一个随笔中我们熟悉了数据流任务,现在来做一个例子,通过实践学习这些介绍的内容。这个例子从AdventureWorks数据库中取得数据,然后对数据进行聚合,排序,计算产生新列操作并输入到一个.csv文件中。新建一个新的package将它重命名为AdventureWorksExtract.dtsx,在control flow中拖放一个数据流任务,双击进入data flow 界面在data flow界面内拖放一个OLE DB数据源,右击重命名为TransactionHistory,双 击打开编辑界面AdventureWorks数据库连接如果已经存在就直接选择它,如果不存在点击新建一个连接新建连接 阅读全文
posted @ 2011-04-13 18:59 nd 阅读(2416) 评论(0) 推荐(1)
摘要: 在上一篇随笔中列举了部分Data Flow中的数据转换任务,这里继续剩余的转换任务。 数据挖掘请求数据挖掘任务是SSIS中一个很重要的任务,它的思想来源于一些算法。数据挖掘请求运行数据挖掘请求,并将结果输出到数据流。它还可以添加一些预测新列,一些应用场合如下列举:根据已知的一些列,例如子女个数,家庭收入,配偶收入预测产生一个新列:这个人是否拥有住房根据客户购物卡预测客户的购买意向可以填充用户的调查问卷上没有填写的空白栏涉及到的算法有:微软时序算法微软决策树算法微软线性回归算法贝叶斯算法 模糊排序和查找模糊排序task可以找出数据中可能重复的行,例如可以找出包含“Main St.”和“Main 阅读全文
posted @ 2011-04-12 19:30 nd 阅读(3037) 评论(2) 推荐(0)
摘要: 对数据流来说按照需求将数据转换成需要的格式是数据操作中的一个关键的步骤。例如想要得到聚合排序后的运算结果,转换可以实现这种操作。和SQL Server 2000 DTS完全不同,这些操作不需要编写script,所有的运算都在内存中进行。添加一个数据转换之后,数据直接转换成想要的格式然后传递给下一个步骤,由于是在内存中完成运算操作的,不需要在数据库中建立对象来存储这些操作函数。但是当需要处理大批量的数据时,还是需要建立存储表或其他对象来处理的。在data flow面板中拖放一个转换,鼠标点住然后拖放绿色连线到一个目的Destination,然后就可以双击并编辑这个转换。这部分将从最基本的功能开始 阅读全文
posted @ 2011-04-11 21:23 nd 阅读(4244) 评论(7) 推荐(2)
摘要: 我们可以把SSIS中的整个package包含在一个事务中,但是如果在package的执行过程中有一个表需要锁定应该怎么处理呢?SSIS内建的事务处理可以解决这个问题。在此之前首先来熟悉一下SQL Server中的事务的概念。 事务SQL Server中的事务是单个的工作单元。如果某一事务成功,则在该事务中进行的所有数据修改均会提交,成为数据库中永久的组成部分。如果事务遇到错误且必须取消或回滚,则所有的数据修改均被清除。在SQL Server中使用事务有可能会造成一些预想不到的结果,具体来说有脏读,不可重复读和幻读三种结果。脏读:脏读是指当一个事务正在访问数据库,并且对数据进行修改,而这种修改还 阅读全文
posted @ 2011-04-10 20:51 nd 阅读(3104) 评论(4) 推荐(4)