linux学习笔记(7)

当从一个文件或命令输出中抽取或过滤文本时,可以使用正则表达式( R E),正则表达式是一些特殊或不很特殊的字符串模式的集合。

                                                            表7-1 基本元字符集及其含义
                    ^ 只只匹配行首
                    $ 只只匹配行尾
                    * 只一个单字符后紧跟*,匹配0个或多个此单字符
                    [ ] 只匹配[ ]内字符。可以是一个单字符,也可以是字符序列。可以使用 - 表示[ ]内字符序列范围,如用[ 1 - 5 ]代替[ 1 2 3 4 5 ]
                    \ 只用来屏蔽一个元字符的特殊含义。因为有时在s h e l l中一些元字符有特殊含义。\可以使其失去应有意义
                    . 只匹配任意单字符
                    p a t t e r n \ { n \ } 只用来匹配前面p a t t e r n出现次数。n为次数
                    p a t t e r n \ { n,\ } m 只含义同上,但次数最少为n
                    p a t t e r n \ { n,m \ } 只含义同上,但p a t t e r n出现次数在n与m之间

使用句点匹配单字符
句点“.”可以匹配任意单字符。例如,如果要匹配一个字符串,以b e g开头,中间夹一个任意字符,那么可以表示为b e g . n,“.”可以匹配字符串头,也可以是中间任意字符。

在行首以^匹配字符串或字符序列
^只允许在一行的开始匹配字符或单词。
。^在正则表达式中使用频繁,因为大量的抽取操作通常在行首。在行首第4个字符为1,匹配操作表示为:
              ^ . . . 1

在行尾以$匹配字符串或字符
可以说$与^正相反,它在行尾匹配字符串或字符, $符号放在匹配单词后。假定要匹配以单词t r o u b l e结尾的所有行,操作为:
               t r o u b l e $
类似的,使用1 d $返回每行以1 d结尾的所有字符串。

如果只返回包含一个字符的行,操作如下:
               ^ . $

posted @ 2008-08-05 10:49  Salesforce  阅读(156)  评论(0编辑  收藏  举报