shirley_cst

博观而约取,厚积而薄发;淡泊以明志,宁静以致远。
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

笔记:正则表达式

Posted on 2012-11-01 22:05  shirley_cst  阅读(161)  评论(0)    收藏  举报

元字符(metacharacter)

\b  代表单词的开头或结尾,即单词的分界处。\b不匹配空格、换行、标点符号等任意分隔符,只匹配一个位置。

 ^  匹配开始位置。

 $  匹配结束位置。

 .  匹配除了换行符以外的任意字符。

\s  匹配任意空白符,包括:空格、制表符(Tab)、换行符、中文全角空格等。

\w  匹配字母、数字、下划线、汉字等。

\d  匹配一位数字(0到9)。

字符转义

 \  查找元字符时用\进行转义,例如:www\.baidu\.com表示查找www.baidu.com,C:\\windows表示查找"C:\windows"。

重复

    *  重复任意次

    +  重复至少一次

    ?  重复0次或1次

  {n}  重复n次

 {n,}  重复不少于n次

{n,m}  重复不少于n次,不大于m次

 

 

参考资料

1. 正则表达式30分钟入门教程:http://deerchao.net/tutorials/regex/regex.htm

 

cat valid_keyad.DF | awk -F"\t" '{ print $1; }' | sed -r "s/[\x81-\xFE][\x40-\xFE]//g" | less

awk '/^[012abcABC]+$/' termlist | less

export LC_ALL=POSIX