元字符(metacharacter)
\b 代表单词的开头或结尾,即单词的分界处。\b不匹配空格、换行、标点符号等任意分隔符,只匹配一个位置。
^ 匹配开始位置。
$ 匹配结束位置。
. 匹配除了换行符以外的任意字符。
\s 匹配任意空白符,包括:空格、制表符(Tab)、换行符、中文全角空格等。
\w 匹配字母、数字、下划线、汉字等。
\d 匹配一位数字(0到9)。
字符转义
\ 查找元字符时用\进行转义,例如:www\.baidu\.com表示查找www.baidu.com,C:\\windows表示查找"C:\windows"。
重复
* 重复任意次
+ 重复至少一次
? 重复0次或1次
{n} 重复n次
{n,} 重复不少于n次
{n,m} 重复不少于n次,不大于m次
参考资料
1. 正则表达式30分钟入门教程:http://deerchao.net/tutorials/regex/regex.htm
cat valid_keyad.DF | awk -F"\t" '{ print $1; }' | sed -r "s/[\x81-\xFE][\x40-\xFE]//g" | less
awk '/^[012abcABC]+$/' termlist | less
export LC_ALL=POSIX
浙公网安备 33010602011771号