文本处理命令
文本处理文件
sort 排序
定义:
用于文件内容排序
格式:
sort [参数] [待处理文件]
[前一个命令处理完的结果] | sort [参数]
参数:
-n :按照数值大小排序
-r :反序排序
-k[列数] :指定列数排序 (默认空字符隔开--空格)
-t ['分隔符'] :指定分隔符,默认分隔符是空格

uniq 筛重
定义:
用于检查删除文本中重复的行 , 一般与sort 一起使用
格式:
uniq [参数] [待处理文件]
sort [参数] [待处理文件] | uniq [参数]
参数:
没有参数的时候只删除相邻的行中重复的行,所有一般排序后在筛重
-c :在每列前面显示该行重复的次数
-d :仅显示重复的行
-u :仅显示不重复的行

cut 指定删除
定义:
用来显示行中的指定部分,删除文件中指定字段
格式:
cut [参数] [待处理的文件]
参数:
-d :制定分隔符分割字符 默认的分隔符为“Tab”
-f[列数] :显示指定的列

tr 替换
定义
替换或者删除命令
格式
cat [待处理文件] | tr [旧内容] [新内容]
替代时是一个一个字符替换,所有
参数
-d : 删除字符

wc 统计
定义
统计,计算数字
格式
wc [参数] [待处理文件]
参数
-c : 统计文件的Bytes数
-l : 统计文件的行数
-w : 统计文件中单词的个数,默认以空白字符做为分隔符
注:在Linux系统中,一段连续的数字或字母组合为一个词


浙公网安备 33010602011771号