sed高级应用

模式空间与保持空间
- 命令选项
模式空间
- 多行命令演示（N/n）
- 多行删除命令（D/d）
保持空间
高级的流程控制命令

模式空间与保持空间

模拟空间：
当前处理输出的缓冲空间，因为sed就是一次处理一行的内容，就会把这一行的内容提取到模式空间，然后用sed命令处理这一行的内容，处理完成后输出到屏幕，接着处理下一行的内容
保持空间：
保持空间就是sed的另一个缓冲区，此缓冲区如其名，不会自动清空内容，也不会把缓冲区的内容打印到的标准输出中

命令选项

P：打印模式空间开端至\n内容，并追加到默认输出之前
h: 把模式空间中的内容覆盖至保持空间中
H：把模式空间中的内容追加至保持空间中
g: 从保持空间取出数据覆盖至模式空间
G：从保持空间取出内容追加至模式空间
x: 把模式空间中的内容与保持空间中的内容进行互换
n: 读取匹配到的行的下一行覆盖至模式空间，打印模式空间的值，并读取下一行。
N：读取匹配到的行的下一行追加至模式空间，它不打印模式空间的值
d: 删除模式空间中的行
D：如果模式空间包含换行符，则删除直到第一个换行符的模

模式空间

sed多行命令
在学习 sed 命令的基础功能时，大家可能注意到了一个局限，即所有的 sed 命令都只是针对单行数据执行操作，在 sed 命令读取缓冲区中的文本数据时，它会基于换行符的位置，将数据分成行，sed 会根据定义好的脚本命令一次处理一行数据，如果一个内容在两行中那么就不好处理了。而sed多行命令则可以解决这些问题。

Next 命令（N）：将数据流中的下一行加进来创建一个多行组来处理。
Delete（D）：删除多行组中的一行。
Print（P）：打印多行组中的一行。

多行命令演示（N/n）

// 这个例子中，sed先查找含有filest单词的哪行文本，然后在用N命令将下一行内容也添加到模式空间中，此时模式空间就有两行内容了，然后再用s命令将换行符\n换成空格

[root@localhost ~]# cat mode1.txt
This is the header line.
This is the first data line.
This is the second data line.
This is the last line.
[root@localhost ~]# sed '/first/{ N ; s/n/ / }' mode1.txt
This is the header line.
This is the first data line. This is the second data line.
This is the last line.

多行删除命令（D/d）

sed 不仅提供了单行删除命令（d），也提供了多行删除命令 D，其作用是只删除缓冲区中的第一行，也就是说，D 命令将缓冲区中第一个换行符（包括换行符）之前的内容删除掉。

演示：
删除数据流中出现在第一行前的空白行，sed会查找空白行，然后用 N 命令来将下一文本行添加到模拟空间。此时如果模拟空间的内容中含有单词 header，则 D 命令会删除缓冲区中的第一行。
D：删除模式空间的第一行

[root@localhost ~]# cat mode2.txt

This is the header line.
This is a data line.

This is the last line.
[root@localhost ~]# sed '/^$/{N ; /header/D}' mode2.txt
This is the header line.
This is a data line.

This is the last line.

d：清空模式空间

[root@localhost ~]# cat lzx 
1
2
11
22
111
222
[root@localhost ~]# sed  '/1/d'  lzx 
2
22
222

保持空间

用于临时存储数据的，可以和模拟空间数据相互复制，但是不能进行修改。

命令	含义
h	将模式空间的内容覆盖到保持空间内容
H	将模式空间的内容追加到保持空间
g	将保持空间的内容复制到模式空间中
G	将保持空间的内容追加到模式空间中
x	交换保持空间和模式空间的内容
演示：

h/G组合使用：

[root@localhost ~]# cat mode1
1
2
11
22
111
222
[root@localhost ~]# sed '/1/{h;d};/2/{G}' mode1
2
1
22
11
222
111

g/H组合使用

// 复制模式空间内容到保持空间，在将匹配到模式空间的内容追加到保持空间中。然后将保持空间的内容覆盖到模式空间中输出
[root@localhost ~]# cat mode1
1
2
11
22
111
222

[root@localhost ~]# sed '/1/h;/2/H;g' mode1
1
1
2
11
11
22
111
111
222

大小写字母转换

//小写字母转换为大写字母
[root@localhost ~]# cat mode 1
find the Match statement
Consult the Get statement
Using the Read statement to retrieve data

[root@localhost ~]# cat sed
/the .* statement/{              //匹配包含这一段的行
h                                //匹配内容从模式空间覆盖到保持空间中
s/.*the (.*) statement.*/\1/	 //将匹配到的行替换成整行
y/abcdefghijklmnopqrstuvwxyz/ABCDEFGHIJKLMNOPQRSTUVWXYZ/		//转换命令将小写字母转换为大写字母，大转小调换一下位置即可
G									//保存在保持空间中的行追加到模式空间
s/(.*)\n(.*the ).*( statement.*)/\2\1\3/		
//排序，按照2.1.3顺序排列匹配到的内容 第一个小括号是1 第二个小括号是2...
}

[root@localhost ~]# sed -rf sed mode 1
find the MATCH statement
Consult the GET statement
Using the READ statement to retrieve data

//第二行不转换大小字母
[root@localhost ~]# cat sed01
/the .* statement/{
/Get/b end
h
s/.*the (.*) statement.*/\1/
y/abcdefghijklmnopqrstuvwxyz/ABCDEFGHIJKLMNOPQRSTUVWXYZ/
G
s/(.*)\n(.*the ).*( statement.*)/\2\1\3/
:end
}

[root@localhost ~]# sed -rf sed01 mode1
find the MATCH statement
Consult the Get statement
Using the READ statement to retrieve data

x：
将模式空间中的内容与保持空间中的内容进行互换交换

[root@localhost ~]# cat lzx 
1
2
11
22
111
222

[root@localhost ~]# sed '/22/{x;p;x}' lzx 
1
2
11

22
111

222

高级的流程控制命令

sed 程序的执行过程会从第一个脚本命令开始，一直执行到最后一个脚本命令（D 命令是个例外，它会强制 sed 返回到脚本的顶部，而不读取新的行）。sed 提供了 b 分支命令来改变命令脚本的执行流程，其结果与结构化编程类似。

分支命令格式：
Branch命令用于在脚本中将控制流转到另一行。

[address]    [label]

address：决定在哪行或哪些行执行分支命令
label：参数定义于何处分支

address 参数决定了哪些行的数据会触发分支命令，label 参数定义了要跳转到的位置。
需要注意的是，如果没有加 label 参数，跳转命令会跳转到脚本的结尾，比如：

[root@localhost ~]# cat mode2
This is the header line.
This is the first data line.
This is the second data line.
This is the last line.

[root@localhost ~]# sed '{2,3b ; s/This is/Is this/ ; s/line./test?/}' mode2
Is this the header test?
This is the first data line.
This is the second data line.
Is this the last test?

posted @ 2022-08-03 00:17 夏天的海阅读(73) 评论(0) 收藏举报

刷新页面返回顶部

lzx4396zzz