LeetCode692. 前K个高频单词

给一非空的单词列表,返回前 k 个出现次数最多的单词。

返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率,按字母顺序排序。

示例 1:

输入: ["i", "love", "leetcode", "i", "love", "coding"], k = 2
输出: ["i", "love"]
解析: "i" 和 "love" 为出现次数最多的两个单词,均为2次。
注意,按字母顺序 "i" 在 "love" 之前。
 

示例 2:

输入: ["the", "day", "is", "sunny", "the", "the", "the", "sunny", "is", "is"], k = 4
输出: ["the", "is", "sunny", "day"]
解析: "the", "is", "sunny" 和 "day" 是出现次数最多的四个单词,
出现次数依次为 4, 3, 2 和 1 次。

class Solution {
    public List<String> topKFrequent(String[] words, int k) {
        //使用哈希表存储每个单词出现的频率
        Map<String,Integer> count = new HashMap<>();
        for(String word:words)
            count.put(word,count.getOrDefault(word,0) + 1);
        //使用小根堆存放前k大出现频率的单词,其排序方法为对比单词在哈希表中存放的频率
        PriorityQueue<String> heap = new PriorityQueue<>(
            (w1,w2)->count.get(w1).equals(count.get(w2))? w2.compareTo(w1):count.get(w1) - count.get(w2));
        //将单词放入堆中,并保持只有k个元素。
        for(String word:count.keySet())
        {
            heap.offer(word);
            if(heap.size()>k)
                heap.poll();
        }
        //此时获得的heap只包含前k大频率的单词了
        //将其按顺序出堆,再反转链表即可得到答案。
        List<String>res = new ArrayList<>();
        while(!heap.isEmpty())
            res.add(heap.poll());
        Collections.reverse(res);
        return res;
    }
}

 

posted @ 2021-03-28 13:11  γGama  阅读(63)  评论(0)    收藏  举报