sed操作

命令格式:sed [选项] [命令] [输入文件]
- 选项
- -n :只打印模式匹配的行,一般与 p 一起使用。如:sed -n ' 2p ' /data 表示输出/data的第二行,如:sed -n '20,30p' /data/boy显示 /data/boy的20到30行。
- -e :进行多项编辑,即对输入行应用多条sed命令时使用,此为默认选项。如:sed -e '/^#/d' -e '/^$/d' /data/boy表示删除空格的行和#开头的行。
- -f :将sed的动作写在一个脚本文件内,用–f filename 执行filename内的sed动作。
- -r :支持扩展表达式
- -i :直接修改文件内容,如:sed -i s#old#new#g
- 命令
- d :delete, 删除匹配到的行;
- p :print, 显示匹配到的行;通常 p 会与参数 sed -n 一起用
- a \text:append, 在指定行后追加文本text,支持使用\n实现多行追加;
- i \text :insert, 在指定行前插入文本text,支持使用\n实现多行插入;
- c \text:将指定行的内容替换为文本text;
- w /file:write, 保存模式空间中匹配到的行至指定的文件中;
- r /file :read, 将指定文件的内容读取至当前模式空间中被匹配到的行后面,常用于实现文件合并;
- sed -i '/Ethernet/r myfile' test 匹配Ethernet的行,读进来另一个文件的内容,读进来的文件的内容会插入到匹配Ethernet的行后
- s/pattern/replaces/:查找pattern用replaces替换;分隔符可自行指定,常用的分隔符有/, #, @等;
- 替换标记:
- g:全局替换;
- w /file:将替换的结果保存至指定文件中;sed -i 's/pattern/replaces/w my.txt' test 将替换后的结果保存到my.txt中
- p:显示替换成功的行;
- 替换标记:
- y:用于(对应)转换字符;
- =:打印行号;
- ! :匹配后取反;
- l :打印行号,并显示控制字符;
- q:读取匹配到的行后退出;
对文本的操练

-
10{sed-commands} 对第10行操作
-
10,20{sed-commands} 对10到20行操作,包括第10,20行
-
10,+20{sed-commands} 对10到30(10+20)行操作,包括第10,30行
-
1~2{sed-commands} 对1,3,5,7,……行操作
-
10,${sed-commands} 对10到最后一行($代表最后一行)操作,包括第10行
-
/oldboy/{sed-commands} 对匹配oldboy的行操作
-
/oldboy/,/Alex/{sed-commands} 对匹配oldboy的行到匹配Alex的行操作
-
/oldboy/,${sed-commands} 对匹配oldboy的行到最后一行操作
-
/oldboy/,10{sed-commands} 对匹配oldboy的行到第10行操作,
- 注意:如果前10行没有匹配到oldboy,sed软件会显示10行以后的匹配oldboy的行,如果有。
-
1,/Alex/{sed-commands} 对第1行到匹配Alex的行操作
-
/oldboy/,+2{sed-commands} 对匹配oldboy的行到其后的2行操作
分组替换( )和\1的使用说明
- sed软件的( )的功能可以记住正则表达式的一部分,其中,\1为括号中的匹配内容,\2为第二个小括号中的匹配内容,sed最多可以记住9个。
// 例:echo I am oldboy teacher.如果想保留这一行的单词oldboy,删除剩下的部分,使用圆括号标记想保留的部分。
echo I am oldboy teacher. |sed 's#^.*am \([a-z].*\) tea.*$#\1#g'
// 用oldboy字符替换I am oldboy teacher.
/*
下面解释用□代替空格:
^.*am□ –>这句的意思是以任意字符开头到am□为止,匹配文件中的I am□字符串;
\([a-z].*\)□–>这句的外壳就是括号\(\),里面的[a-z]表示匹配26个字母的任何一个,[a-z].*合起来就是匹配任意多个字符,本题来说就是匹配oldboy字符串,由于oldboy字符串是需要保留的,因此用括号括起来匹配,后面通过\1来取oldboy字符串。
□tea.*$–>表示以空格tea起始,任意字符结尾,实际就是匹配oldboy字符串后,紧接着的字符串□teacher.;
后面被替换的内容中的\1就是取前面的括号里的内容了,也就是我们要的oldboy字符串。
()是扩展正则表达式的元字符,sed软件默认识别基本正则表达式,想要使用扩展正则需要使用\转义,即\(\)。sed使用-r选项则可以识别扩展正则表达式,此时使用\(\)反而会出错。
*/
浙公网安备 33010602011771号