摘要:
什么是数据挖掘?数据挖掘(Data Mining),又称信息发掘(Knowledge Discovery),是用自动或半自动化的方法在数据中找到潜在的,有价值的信息和规则。数据挖掘技术来源于数据库,统计和人工智能。数据挖掘能够做什么对企业中产生的大量的数据进行分析,找出其中潜藏的规则更加清晰的了解目... 阅读全文
posted @ 2014-10-27 21:52
Bobby0322
阅读(3702)
评论(0)
推荐(0)
摘要:
Microsoft SQL Server是一个提供了联机事务处理、数据仓库、电子商务应用的数据库和数据分析的平台。体系架构是描述系统组成要素和要素之间关系的方式。Microsoft SQL Server系统的体系结构是对Microsoft SQL Server的主要组成部分和这些组成部分之间关系的描... 阅读全文
posted @ 2014-10-27 20:29
Bobby0322
阅读(4191)
评论(0)
推荐(1)
摘要:
百分比抽样和行抽样可以从数据源中随机选择一组数据。这两种task都可以产生两组输出,一组是随机选择的,另一组是没有被选择的。可以将这些选择出的数据发送到开发或者测试服务器上。这个Task的最合适的应用是建立数据挖掘模型然后,使用这些抽样数据来验证这个模型。编辑这种task,选择要抽取的行数或者 百分... 阅读全文
posted @ 2014-10-27 17:12
Bobby0322
阅读(1046)
评论(0)
推荐(0)
摘要:
根据条件分割数据是一个在数据流中添加复杂逻辑的方法,它允许根据条件将数据输出到其他不同的路径中。例如,可以将TotalSugar= 27.4406的输出到另一个路径。如图。可以从上面的属性结构中拖放一个列或者代码段,然后根据逻辑重命名而不是使用默认值Case1,还可以编辑输出列的名字。 阅读全文
posted @ 2014-10-27 16:08
Bobby0322
阅读(601)
评论(0)
推荐(0)
摘要:
派生列转换通过对转换输入列应用表达式来创建新列值。 表达式可以包含来自转换输入的变量、函数、运算符和列的任意组合。 结果可作为新列添加,也可作为替换值插入到现有列。 派生列转换可定义多个派生列,任何变量或输入列都可以出现在多个表达式中。可以使用此转换执行下列任务:将不同列的数据连接到一个派生列中。 ... 阅读全文
posted @ 2014-10-27 15:46
Bobby0322
阅读(893)
评论(0)
推荐(0)
摘要:
排序转换允许对数据流中的数据按照某一列进行排序。这是五个常用的转换之一。连接数据源打开编辑界面,编辑这种任务。不想设置为排序列的字段不要选中,默认情况下所有列都会选中。如图所示,按照TotalSugar_Cnt排序,并将所有列输出。在底部的表格中,可以设置输出列的别名,是否按照列来排序。Sort O... 阅读全文
posted @ 2014-10-27 14:00
Bobby0322
阅读(645)
评论(0)
推荐(0)
摘要:
数据转换执行类似于T-SQL中的函数CONVERT或CAST的功能。数据转换的编辑界面如图,选择需要转换的列,在DataType下拉列表中选择需要的数据类型。Output Alias栏内设置输出时使用的别名。 阅读全文
posted @ 2014-10-27 13:47
Bobby0322
阅读(637)
评论(0)
推荐(0)
摘要:
特征映射转换如图展示数据流中列的特征,它的编辑界面很简单,只有一个标签界面,点击要进行映射的列,可以选择需要添加新列或需要更新的列。可以在Output Alias列中给原来的列一个别名,选择要进行的操作,可以进行的操作类型有:Byte Reversal:逆转数字位的顺序,例如数据0x1234 0x9... 阅读全文
posted @ 2014-10-27 13:11
Bobby0322
阅读(838)
评论(0)
推荐(0)
摘要:
审核转换允许对数据流添加审核审核数据,以往使用HIPPA和Sarbanes-Oxley (SOX)时,必须跟踪谁在什么时插入数据,审核转换可以实现这种功能。例如要跟踪那一个task向表里插入数据,可以在审核转换中添加相应的列。在Output Column Name列中输入想要审核的列,在Audit ... 阅读全文
posted @ 2014-10-27 12:51
Bobby0322
阅读(507)
评论(0)
推荐(0)
摘要:
聚合转换可以像T-SQL中的函数GROUP BY, Average, Minimum, Maximum, 和 Count一样对数据进行聚合运算。在图中可以看到数据以SampleID分组,对TotalSugar做Average、Maximum、Minimum、Count操作。这样产生了4列新的数据,供... 阅读全文
posted @ 2014-10-27 11:45
Bobby0322
阅读(933)
评论(0)
推荐(0)


浙公网安备 33010602011771号