Linux uniq命令

介绍

uniq命令是一个文本去重命令,它能对标准输入和文本文件进行去重操作,并且能将结果通过stdout输出,uniq命令经常会同sort命令一起使用,uniq命令默认对多条重复的行只显示一行。

 

参数

  -c, --count           在每行记录前显示该行内容的数量
  -d, --repeated        仅显示重复的记录行,并且去重
-D, --all-repeated[=delimit-method] 仅显示重复的行,并不去重
-f, --skip-fields=N avoid comparing the first N fields -i, --ignore-case 去重显示,uniq的默认参数
-s, --skip-chars=N 指定忽略行的前N个字符 -u, --unique 仅显示非重复的行
-z, --zero-terminated 末尾生成0个字节的终止符作为输出(\0),这样的目的就是避免一条记录行因为存在空格被识别为多行
-w, --check-chars=N 只对比指定的N个字符,默认是从开始算起,如果和-s一起使用那么要排除-s指定的字符数

测试数据

 

1.显示行的数量

2.只显示重复的行

 

3.仅显示非重复的行

4.-s和-w

-s 2:忽略前两个字符,即从第二列开始比较

-w 2:只比较两个字符,即只比较第二列的前两个字符

所以,ja、fe、ma个取了重复的第一条记录行

5.生成0个字节的终止符,\0

例如:当文本中的行记录是以空格分隔,并且需要将标准输出传给xargs,由于xargs是以空格作为分隔符,但是实际需要将整个文本内容作为一个完整的输出,这个时候就需要使用-z参数在文本末尾生成\0的终止符告诉程序整个文本作为一个整体,

[root@localhost test]# cat test
a b 
c d
[root@localhost test]# uniq  test |xargs 
a b c d

 

注意:结果并不是我们要的结果,这时就需要文本的末尾生成\0的分隔符作为行的行的结束标示

[root@localhost test]# uniq -z test |xargs -0
a b
c d 

使用了-z参数之后就将整个文本作为一个整体在末尾生成一个\0的分隔符

总结

 

 

 

 

备注:

    作者:pursuer.chen

    博客:http://www.cnblogs.com/chenmh

本站点所有随笔都是原创,欢迎大家转载;但转载时必须注明文章来源,且在文章开头明显处给明链接。

《欢迎交流讨论》

posted @ 2016-05-23 19:59  pursuer.chen  阅读(1464)  评论(0编辑  收藏  举报