摘要: //本函数功能是:根据数组array a构建堆 void HeapAdjust(int *a, int s, int m){ int temp, i; temp = a[s]; for(i = 2*s; i= a[i]) break; a[s] = a[i]; s = i; } a[s] = temp;}//首先可以看到堆建好之后堆中第0个数据是堆中最小的数据。取出这个数据再执行下堆的删除操作。这样堆中第0个数据又是堆中最小的数据,重复上述步骤直至堆中只有一个数据时就直接取出这个数据。//由于堆也是用数组模拟的,故... 阅读全文
posted @ 2013-11-07 15:00 yansaibo 阅读(151) 评论(0) 推荐(0)
摘要: 1.论文来源 04年ACM2.数据集 GOV2 and WT10G ROBUST, AP and WSJa.使用的检索模型 query-likehood模型 并使用了狄里克莱文档平滑 Coll 是所有的数据集b.聚类思想 使用了K-NN聚类方法,使用TF-IDF来表示文档,余弦近似度度量文档之间的相似度。 主要是一个文档可能有很多高度相似的近邻,一个文档可以出现在多个聚类中。----在文中如果一个文档是多个cluster的成员,cluster与查询高度相关,这个文档就是一个处于支配的文档。 本文中的方法主要是为了寻找这些支配文档 freq(w,Clu) 是Clu类中的所有的 ... 阅读全文
posted @ 2013-11-06 19:40 yansaibo 阅读(270) 评论(0) 推荐(0)