文本过滤涉及到以下知识:
正则表达式、find、grep、awk、sed、合并与分割(sort、uniq、join、cut、paste、split)。
正则表达式:

基本元字符集及其含义:

匹配IP地址:

find:

示例如下:






find命令练习实例:

find和xargs一起使用:


find和grep联合使用时,find会把所有找到的条目一次性传递给grep,有多少条就开多少个进程。

grep用法:

示例如下:

grep是检索行用的。awk是检索列,sed进行字符替换。 三者经常联合使用。
grep的正则表达式模式:

grep原理总结:

awk命令:


awk有三种调用模式:

示例程序如下:

awk打印了passwd文件的第一列,-F参数表示文件中的分隔符,在本例中是冒号:,花括号里面表示打印第一列。
打印第一列和第三列,并且中间空一个制表符,如下所示:

打印第三列大于500的,如下:


grep与awk联合使用示例:


$0代表打印一整行。
带排序的grep与awk联合使用:

其中-n代表按数字方式, -k7代表按照第7列排序。

tail代表从最后一行开始取。sort加上-r表示逆序,如下:


sed提取数据,如下:

其中sed表示提取第5-10行的数据,p表示打印出来。


sed命令:



只带一个'p'表示打印所有行,包括空行。

sed后的2表示从第二行开始打印,一直打印到含有bb的行,p表示打印。
打印空行,=表示第几行,如下:





sed中的-i表示覆盖掉原来的文件,就是会对源文件进行修改。

sed的主要两个用途:
1、按照一个范围(第几行到第几行)提取数据
2、sed的主要用法是编辑功能,对提取的数据进行修改、替换、删除、插入等
ipcs进程间通信工具,这是一个命令,可以使用man ipcs查看其具体使用方法。
ipcrm可以删除共享内存,如下所示:

ipcclean脚本:


浙公网安备 33010602011771号