shell一句实现wordcount

比如一个wc.txt文件

hello java java
spark spark
scala hadoop
python shell
shell

cat wc.txt | tr -s ' ' '\n' | uniq -c | sort -r | awk '{print $2" "$1}'

运行结果:

spark 2
shell 2
java 2
scala 1
python 1
hello 1
hadoop 1

解释:

  tr -s ' ' '\n'    :tr -s ' '的作用是把多个重复的空格字符压缩为一个;后面再接一个选项‘\n’,就是替换空格字符为换行符。整个作用是把文本内容拆为一个单词一行。

  uniq -c    :uniq作用是删除重复行。-c选项是在行前显示出现的次数。

  sort -r    :sort作用是排序。-r是反过来排序。

  awk       :这里只是简单的打印了第二列和第一列。

posted @ 2019-12-09 12:38  手写伪代码  阅读(798)  评论(0)    收藏  举报