shell一句实现wordcount
比如一个wc.txt文件
hello java java
spark spark
scala hadoop
python shell
shell
cat wc.txt | tr -s ' ' '\n' | uniq -c | sort -r | awk '{print $2" "$1}'
运行结果:
spark 2
shell 2
java 2
scala 1
python 1
hello 1
hadoop 1
解释:
tr -s ' ' '\n' :tr -s ' '的作用是把多个重复的空格字符压缩为一个;后面再接一个选项‘\n’,就是替换空格字符为换行符。整个作用是把文本内容拆为一个单词一行。
uniq -c :uniq作用是删除重复行。-c选项是在行前显示出现的次数。
sort -r :sort作用是排序。-r是反过来排序。
awk :这里只是简单的打印了第二列和第一列。
浙公网安备 33010602011771号