Linux uniq命令

介绍

uniq命令是一个文本去重命令，它能对标准输入和文本文件进行去重操作，并且能将结果通过stdout输出，uniq命令经常会同sort命令一起使用，uniq命令默认对多条重复的行只显示一行。

参数

  -c, --count           在每行记录前显示该行内容的数量
  -d, --repeated        仅显示重复的记录行，并且去重
  -D, --all-repeated[=delimit-method]  仅显示重复的行，并不去重
  -f, --skip-fields=N   avoid comparing the first N fields
  -i, --ignore-case     去重显示，uniq的默认参数
  -s, --skip-chars=N    指定忽略行的前N个字符
  -u, --unique          仅显示非重复的行
  -z, --zero-terminated  末尾生成0个字节的终止符作为输出（\0）,这样的目的就是避免一条记录行因为存在空格被识别为多行
  -w, --check-chars=N   只对比指定的N个字符，默认是从开始算起，如果和-s一起使用那么要排除-s指定的字符数

测试数据

1.显示行的数量

2.只显示重复的行

3.仅显示非重复的行

4.-s和-w

-s 2:忽略前两个字符，即从第二列开始比较

-w 2:只比较两个字符，即只比较第二列的前两个字符

所以，ja、fe、ma个取了重复的第一条记录行

5.生成0个字节的终止符，\0

例如：当文本中的行记录是以空格分隔，并且需要将标准输出传给xargs,由于xargs是以空格作为分隔符，但是实际需要将整个文本内容作为一个完整的输出，这个时候就需要使用-z参数在文本末尾生成\0的终止符告诉程序整个文本作为一个整体，

[root@localhost test]# cat test
a b 
c d

[root@localhost test]# uniq  test |xargs 
a b c d

注意：结果并不是我们要的结果，这时就需要文本的末尾生成\0的分隔符作为行的行的结束标示

[root@localhost test]# uniq -z test |xargs -0
a b
c d

使用了-z参数之后就将整个文本作为一个整体在末尾生成一个\0的分隔符

总结

备注：

作者：pursuer.chen

博客：http://www.cnblogs.com/chenmh

本站点所有随笔都是原创，欢迎大家转载；但转载时必须注明文章来源，且在文章开头明显处给明链接。

《欢迎交流讨论》

posted @ 2016-05-23 19:59 pursuer.chen 阅读(1532) 评论(0) 收藏举报

刷新页面返回顶部

pursuer.chen

LIVE AND LEARN

Linux uniq命令

介绍

总结

公告