692.前K个高频单词
难度:中等
题目:
给一非空的单词列表,返回前 k 个出现次数最多的单词。
返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率,按字母顺序排序。
注意:
- 假定 k 总为有效值, 1 ≤ k ≤ 集合元素数。
- 输入的单词均由小写字母组成。
示例:
示例 1:
输入: ["i", "love", "leetcode", "i", "love", "coding"], k = 2
输出: ["i", "love"]
解析: "i" 和 "love" 为出现次数最多的两个单词,均为2次。
注意,按字母顺序 "i" 在 "love" 之前。
示例 2:
输入: ["the", "day", "is", "sunny", "the", "the", "the", "sunny", "is", "is"], k = 4
输出: ["the", "is", "sunny", "day"]
解析: "the", "is", "sunny" 和 "day" 是出现次数最多的四个单词,
出现次数依次为 4, 3, 2 和 1 次。
分析
这道题相信大家第一时间都能想到将单词列表转化为哈希计数表,但困难的就是如何针对该哈希表进行排序。
这里介绍两种方法,各有所长,供大家参考:
-
如果大家之前做过 179.最大数
那么相信你一定对cmp_to_key这个方法不会陌生,它对于Python3提供了sorted过程中的两两比较功能。
我们只需要单独创建一个函数,针对字典K进行函数式排序即可。 -
如果我们不了解cmp_to_key,那么这道题怎么解?老老实实用嵌套列表。
我们将Counter统计好的字典,按照k,v的形式添加进一个列表,然后在对列表排序的时候,对数字与字符串进行分别排序即可。
解题1: cmp_to_key
from collections import Counter
from functools import cmp_to_key
class Solution:
def topKFrequent(self, words, k):
d = Counter(words)
def cmp(a, b):
if d[a] > d[b]:
return -1
elif d[a] == d[b]:
return -1 if sorted([a, b])[0] == a else 1
else:
return 1
return sorted(d.keys(), key=cmp_to_key(cmp))[:k]
解题2: 列表切片
from collections import Counter
class Solution:
def topKFrequent(self, words, k: int):
d = Counter(words)
tmp = []
for word, num in d.items():
tmp.append((num, word))
ret = sorted(tmp, key=lambda x: (-x[0], x[1]))
return [i[1] for i in ret[:k]]
欢迎关注我的公众号: 清风Python,带你每日学习Python算法刷题的同时,了解更多python小知识。
我的个人博客:https://qingfengpython.cn
网友评论