摘要: 上一节我们已经对训练集建立了word-doc矩阵,每读取矩阵的一行就可以计算出term对应的IG值。最后把结果写入文件。信息增益的计算公式参见我的另一篇博客信息论。代码如下:View Code import java.io.BufferedReader;import java.io.File;imp... 阅读全文
posted @ 2011-11-05 18:15 张朝阳 阅读(4577) 评论(0) 推荐(1) 编辑
摘要: 选择问题即:寻找N个元素中的第K个最大者。选择问题的特殊情况是找最大者或最小者,这当然很简单了。还是一个特例找中位数。《寻找N个元素中的前K个最大者》方法总结是在这里看到的http://zhangliang008008.blog.163.com/blog/static/25136049200882423842325/,我觉得解法二和解法四用得广泛一些,编程实现了一下。利用快速排序中的partition操作经过partition后,pivot左边的序列sa都大于pivot右边的序列sb;如果|sa|==K或者|sa|==K-1,则数组的前K个元素就是最大的前K个元素,算法终止;如果|sa|< 阅读全文
posted @ 2011-11-05 09:48 张朝阳 阅读(3575) 评论(0) 推荐(0) 编辑