摘要: 现有如下题目:有一个海量文本,存储的是汉语词语,要求从中找出前K个出现频率最高的词语,写出最优算法,兼顾时间和空间复杂度。 思路分析:熟悉搜索引擎的程序员,应该不是难题。用传统的HashMap是无法解决的,因为数据量非常庞大的时候,空间复杂度会导致程序运行时,频繁执行MinorGC和MajorGC, 阅读全文
posted @ 2016-03-08 18:45 佟学强 阅读(1364) 评论(0) 推荐(0) 编辑
摘要: 现在有这么一道题目:要求从多个的数据中查找出前K个最小或最大值 分析:有多种方案可以实现。一、最容易想到的是先对数据快速排序,然后输出前k个数字。 二、先定义容量为k的数组,从源数据中取出前k个填充此数组,调整此数组的最大值maxValue到首位,然后对剩下的n-k个数据迭代,对于每个遍历到的数字x 阅读全文
posted @ 2016-03-08 18:25 佟学强 阅读(6546) 评论(1) 推荐(0) 编辑