Shell 命令实现词频统计
杨贵福老师的方法
- cat tr sed sort head 命令的综合使用方式1
$ cat pg11.txt |tr -cs A-Za-z\' '\n' |sed "/'/d"| tr A-Z a-z | sort|uniq -c |sort -k1,1nr -k2 | head
结果为:
    1797 the
    884 and
    804 to
    679 a
    619 of
    537 she
    515 it
    462 said
    423 in
    395 you
\2. cat tr sed sort head 命令的综合使用方式2 (PS:刚刚加了sed这一条,用于删除 ' 这个被匹配的单词)
$ cat pg11.txt |tr -cs A-Za-z\' '\n' | tr A-Z a-z | sort|uniq -c |sort -k1,1nr -k2 | head
结果为:
   1797 the
    884 and
    804 to
    679 a
    619 of
    537 she
    515 it
    462 said
    423 in
    395 you
 
                
            
         
 
         浙公网安备 33010602011771号
浙公网安备 33010602011771号