高效能程序工具之grep

阅读量3.3k
收藏 2
点赞数 1
分类专栏:
版权
7 篇文章
订阅专栏
grep是global regular expression pattern,意思是全局正则表达模式匹配。通俗来讲就是用于模式匹配,或者叫做查找。它有几个变体:
-
egrep ---- 相当于grep -e
-
fgrep ---- 相当于grep -f
-
rgrep ---- 相当于grep -r
这几个不是很常用,已经是Deprecated,建议还是用grep。
命令格式
grep [options] [-e|--regexp PATTERN] PATTERN FILEs
例如: grep -rin --color -E -e "task" -e "run" RunOrStart.java
常用选项
-
-i 忽略大小写
-
-r 递归式的处理子目录
-
-n 输出时带有与模式相匹配的行号
-
-w 仅匹配整个单词,相当于\bPATTERN\b
-
-e 指定一个模式
-
-E 用扩展正则表达式
-
-x 匹配一整行,相当于^PATTERN$
-
-I 忽略二进制文件
-
--color 输出时用颜色来高亮显示匹配的模式
因为某些选项特别的常用,所以可以用alias来改造grep,让其变成默认选项: alias grep="grep -rnEI --color" 解释:
-r 99%的情况下是肯定要查询子目录的。 -n 输出时带有行号可以方便后面的操作。 --color 高亮输出,方便查看 -I 多数情况下,都是处理纯文本(代码,Makefile,config file),所以要忽略二进制文件,就不会出现如下的输出:
alex:~$ grep shell *
Binary file libwebcore.so matches
-E 因为默认情况下是用BRE(Basic Regular Expression),某些操作符如|(alternate), +(one or more repetition)无效,如: grep "task|run" * (no matches)
grep "task|run" * (no matches)
grep "tas\w+r" * (no matches)
用-E来使用ERE(Extended Regular Expression)就可以使用这此:
alex:~/work/java$ grep -E "task|run" *
RunOrStart.java: public void run() {
RunOrStart.java: System.out.println("TestRun.run(), start running are you aware of that" + name);
RunOrStart.java: System.out.println("TestRun.run(), end running" + name);
RunOrStart.java: public void run() {
RunOrStart.java: System.out.println("TastStart.run(), start running are you aware of that" + name);
RunOrStart.java: System.out.println("TastStart.run(), end running" + name);
RunOrStart.java: new TaskRun("taskrun").run();
RunOrStart.java: System.out.println("taskrun is ending");
RunOrStart.java: new TaskStart("with run").run();
RunOrStart.java: System.out.println("taskstart.run is ending");
alex:~/work/java$ grep -E "tas\w+r" *
RunOrStart.java: new TaskRun("taskrun").run();
RunOrStart.java: System.out.println("taskrun is ending");
RunOrStart.java: System.out.println("taskstart.run is ending");
关于引号的使用quoted pattern
先来看二个例子:
alex:~/work/java$ grep tas\w*r *(no outputs)
alex:~/work/java$ grep "tas\w*r" *
RunOrStart.java: new TaskRun("taskrun").run();
RunOrStart.java: System.out.println("taskrun is ending");
RunOrStart.java: System.out.println("taskstart.run is ending");
对于grep的参数PATTERN是一定要用引号的,单引双引均可,以防止Shell对某些具有特殊意义的字符进行扩展,如&,\,|等,如不加引号会变成后台运行,转义和管道。



浙公网安备 33010602011771号