leetcode-192 Word Frequency(统计单词频率)

cat words.txt | tr -s " " "\n"| sort | uniq -c | sort -r | awk '{print $2, $1}'

tr -s " " "\n" : 是将空格替换为换行符，即文件中的单词每一行一个单词

sort 对单词进行排序

uniq -c 统计相同的单词个数单词数目单词

sort -r 正序排序

awk '{print $2,$1}' 按照格式化输出，即最后先输出单词单词数目

如果要求严格一点，我们还应该去掉文章中的标点符号后再进行统计：统计频率最高的前5个单词

cat word.txt| sed 's/[,.?!;]/ /g' | tr -s " " "\n"|sort|uniq -c | sort -r | awk '{print $2,$1}'| head -n 5

posted @ 2019-07-24 20:00 小叶子leavescy 阅读(366) 评论(0) 收藏举报

刷新页面返回顶部

小叶子leavescy