Spiga

随笔档案 - 2009年2月

MDX中TopN函数的使用

2009-02-04 01:06 by Yin.P, 1251 visits, 网摘, 收藏, 编辑
摘要:MDX中的TopN函数是指一类函数,这类函数的作用是从一个集合中选择出满足某个阈值或百分比的元组集合。本文主要介绍TopSum, BottomSum, TopPercent和BottomSum函数。 在实际应用中我们可能会遇到一些需求,需要我们回答类似于"最少销售哪些产品或销售多少产品才能使销量(销售额)达到某个值"、"销售量在前xx%的产品所属的产品分类有哪些"、"客户贡献在前xx%的客户中,对每一个客户,其购买的前xx%的产品所属的产品分类有哪些"等这样的问题。这些问题在MDX中都可以通过TopN系列函数来解决。 阅读全文

KMeans算法演示程序

2009-02-02 11:36 by Yin.P, 6452 visits, 网摘, 收藏, 编辑
摘要:这几天又把《数据挖掘概念与技术》这本书翻出来看了看,随便做了个演示程序实现了书中的K-Means算法。也算是一种复习和积累吧。最先这个算法完全是用C#来做的,数据样本点是用的类作为其数据结构,后来在测试中发现运行速度不太理想。就改为用C++实现算法本身,然后通过C#调用(P\Invoke)C++导出的函数来完成。最终的效果如下面的图所示 阅读全文