Grep/Sed的扩展正则表达式开关，以及利用正则表达式中的分组功能

比如把代码里面所有的close调用，替换成alpclose。于是写了一个脚本，有了一些收获。脚本如下：

#!/bin/bash
case "$#" in
0)
    echo "Usage: ./grepclose.sh <path>"
    exit ;;
1)
    echo "Got path: $1, start working..." ;;
*)
    echo "Too many arguments. Usage: ./grepclose.sh <path>"
    exit ;;
esac

for srcfile in $(find "$1" -name "*.[hc]")
do
    grep -E -e "[ =({;?:\t]+close[ \t]*\(" -e "^close[ \t]*\(" "$srcfile" >& /dev/null
    if [ $? -eq 0 ]; then
        echo "Patching file $srcfile"
        cp "$srcfile" "${srcfile}.fdorig"
        sed -i "s/^close[ \t]*(/alpclose(/g" "$srcfile"
        sed -i -r "s@([ =({;?:\t]+)close[ \t]*\(@\1alpclose\(@g" "$srcfile"
    fi
done

1. 使用grep -E来打开grep的扩展正则表达式的功能。所谓扩展，就是像+, ()这样的元字符才能使用。sed使用-r来打开扩展正则表达式。打开了扩展之后，如果要表示一个常量的+, ()，就需要用\来转义了。
2. grep -e可以用来表示多个匹配pattern
3. 最后一句sed的时候，使用了正则表达式中的分组功能，也就是将[ =({;?:\t]+这个部分定义成一个组，然后在后面就可以用\1来引用（注意\0已经被默认分配成整个pattern）。如果定义了第二个组，那么就用\2来引用。这个很有用，因为在替换的时候，我们不能把close前面的字符删除，所以要保留close前面匹配到的字符，于是分组就特别好用了。

4. 上述的匹配逻辑是这样的：首先，close顶行头写的，OK；其次，close前面允许有一个或多个空格，等号，小括号，大括号，分号，问号，冒号，tab。其他字符一概不行；最后，close字符串后面允许有0个或者多个空格或tab，然后要有一个小括号。

posted @ 2011-01-03 11:13 super119 阅读(959) 评论(0) 收藏举报

刷新页面返回顶部

Super的博客

教不会别人就是你自己还没搞懂

Grep/Sed的扩展正则表达式开关，以及利用正则表达式中的分组功能

公告