2009-05-30 23:48 by Yin.P, 171 visits, 网摘, 收藏, 编辑
摘要:It's really a piece of cake to debug MDX procedure in Visual Studio. It will be done just in only a few steps. In Visual Studio 2010(the same to VS2005 and VS2008), you should attach the MDX procedure project to the Analysis Service process(msmdsrv.exe), and then the assemblies which are needed will be loaded automatically. The specific MDX procedure will also be loaded by Analysis Service.
阅读全文
2009-05-26 21:18 by Yin.P, 879 visits, 网摘, 收藏, 编辑
摘要:在Visual Studio中调试MDX存储过程非常简单,只要几步设置就可以实现。对于Visual Studio 2010(与VS2005和VS2008的设置方法相同)。在Visual Studio中将存储过程项目附加到分析服务器进程(msmdsrv.exe进程),附加进程之后它会自动加载程序集
阅读全文
2009-05-26 21:17 by Yin.P, 1240 visits, 网摘, 收藏, 编辑
摘要:SSAS的MDX脚本提供了强大的数据分析查询功能,然而在实际使用中同样会遇到一些问题使得用MDX来表达比较困难,因为MDX并不能提供满足年有数据分析需求的函数,这个时候可以尝试通过基于.NET的存储过程以编程的方式来完成我们特定的功能需求。基于.NET的MDX存储过程支持所有基于.NET平台的编程语言。
阅读全文
2009-05-22 20:43 by Yin.P, 2436 visits, 网摘, 收藏, 编辑
摘要:DBSCAN算法是常用的数据挖掘算法。所有的聚类方法分为若干类型,前面讨论过的KMEANS算法是基于划分的方法进行聚类,而这次提到的DBSCAN算法是基于密度的方法。当然其它的还有基于层次凝聚和分裂的方法、基于模型的方法等。我先对Weka中实现的DBSCAN算法进行一个介绍和分析,然后再给出我自己的实现方法。但是在这之前要解释几个概念,如果之前没有了解过这个算法的话,最好是先熟悉几个概念:epsilon-邻域、核心对象、(直接)密度可达、密度相连,这些概念可以在《数据挖掘概念与技术》一书中找到,了解这些概念对理解这个算法来说是很重要的。
阅读全文
2009-05-14 23:16 by Yin.P, 1996 visits, 网摘, 收藏, 编辑
摘要:文本相似计算是进行文本聚类的基础,和传统结构化数值数据的聚类方法类似,文本聚类是通过计算文本之间"距离"来表示文本之间的相似度并产生聚类。文本相似度的常用计算方法有余弦定理和Jaccard系数。但是文本数据与普通的数值数据或类属数据不同,文本数据是一种半结构化数据,在进行文本挖掘之前必须要对文本数据源进行处理,如分词、向量化表示等,其目的就是使用量化的数值来表达这些半结构化的文本数据。使其适用于分析计算。
阅读全文