文本处理命令

文本处理文件

sort 排序

  定义:

    用于文件内容排序

 

  格式:

    sort [参数] [待处理文件]

    [前一个命令处理完的结果] | sort [参数]

 

  参数:

    -n           :按照数值大小排序

    -r                 :反序排序

    -k[列数]       :指定列数排序 (默认空字符隔开--空格)

    -t ['分隔符'] :指定分隔符,默认分隔符是空格

 

 

uniq 筛重

  定义:

    用于检查删除文本中重复的行 , 一般与sort 一起使用

 

  格式:

    uniq [参数] [待处理文件]

    sort [参数] [待处理文件] | uniq [参数]

 

  参数:

    没有参数的时候只删除相邻的行中重复的行,所有一般排序后在筛重

    -c :在每列前面显示该行重复的次数

    -d :仅显示重复的行

    -u :仅显示不重复的行

 

 

 

 

cut 指定删除

  定义:

    用来显示行中的指定部分,删除文件中指定字段

  

  格式:

    cut  [参数] [待处理的文件]

 

  参数:

    -d     :制定分隔符分割字符  默认的分隔符为“Tab”

    -f[列数]  :显示指定的列

 

 

tr 替换

  定义

    替换或者删除命令

 

  格式

    cat [待处理文件] | tr [旧内容] [新内容]

    替代时是一个一个字符替换,所有

  参数

    -d   : 删除字符

 

 

wc 统计

  定义

    统计,计算数字

 

  格式

    wc [参数] [待处理文件]

 

  参数    

    -c  : 统计文件的Bytes数

    -l   : 统计文件的行数

    -w : 统计文件中单词的个数,默认以空白字符做为分隔符

 

  注:在Linux系统中,一段连续的数字或字母组合为一个词

 

 

 

END

posted @ 2021-12-21 17:41  Snails蜗牛  阅读(53)  评论(0)    收藏  举报