微软BI开拓者

www.windbi.com

 

SQL Server 2005数据挖掘时间序列算法及其优化

如果引用此文,请注明转载自www.windbi.com,多谢!

时间序列算法是用于分析和预测基于时间的数据,该算法的主导思想是基于过去预测未来,是决策树算法技术的延伸。

时间序列算法的主要应用场景有两个,一是预测未来产品的销售情况,二是执行交叉预测,查看各个产品型号的销售是否相关。
下面我们以一个实际的例子来看理解SQL Server 2005中时间序列算法。
一、案例需求
某零售商对于本公司的销售业绩通过多种方法(包括使用OLAP技术建立多维数据库,进行多维分析),已经很好的掌握了在过去的历史销售中,各个产品的销售走势如何,某个产品在所有产品中的销售比例如何,等等。那么除了这些,他们现在最想知道的就是,通过现有的销售情况预测下个月,后者是下一个时间段的销售情况,对于销售的影响因素为当前的库存和当月的销售,如何来做呢?
二、准备数据
使用ETL或者其他的数据整合方式,将我们所需的数据准备好的,我们需要的数据,当前只要一张表就可以了,这张表的有这样几列:编号(表示单一客户单一产品编号,如1002573361),时间(如:200706),库存(如:201),销售(如:49)。
三、建立模型
我们使用Visual Studio平台,建立分析服务的项目,首先第一步就是要定义好数据源,选取本机的Test数据库作为数据挖掘的数据源:




第二步是要定义数据源视图:


。。。。。。
具体请参阅http://www.windbi.com/showtopic.aspx?page=end&topicid=217;敬请见谅,多谢!

posted on 2007-06-24 22:02  王 如 涛  阅读(281)  评论(0)    收藏  举报

导航