.net中的正则表达式使用高级技巧 (一)

  .net中的正则表达式使用高级技巧

前言

一、本系列文章不讲述基本的正则语法,这些可以在微软的JS帮助文档中找到,也可以Google一下
二、写系列文章的原因
1、正则很有用,而且经常要用
2、正则的一些高级用法有相当一部分人还没有理解和掌握
3、刚好又在网上看到了一篇文章错误的使用了正则式,使我有了写本文的冲动
4、本系列文章的大部分知识可同时适用于.net语言,JavaScript
三、本系列文章特点:尽量使用小例子来说明相对难懂而很多正则书籍都没有说清的正则语法
四、本系列文章内容:替换的高级语法,内联表达式选项,组,反向引用,正声明,负声明,正反声明,负反声明,非回溯匹配,判断式,.net正则引擎特点等 

 


因为
.net的基本正则语法和Perl5基本相同,所以基本语法你可以去下载一下M$JS帮助文档,上面有详细的说明\d表示什么,{,5}表示什么,\[表示什么……,这里我只想提醒大家一点,为了避免和反向引用相冲突,在你用\nn表示八进制的ASCII码时,请在\后加0就是说,\40在表示ASCII码时,请这样写\040

替换

Regex类有一个静态的Replace方法,其实例也有一个Replace方法,这个方法很强大,因为它可以传入一个delegate,这样,你可以自定义每次捕获匹配时,如何处理捕获的内容。 

        public static void Main()
        
{    
            
string s = "1 12 3 5";
            s 
= Regex.Replace(s,@"\d+",new MatchEvaluator(CorrectString),RegexOptions.Compiled|RegexOptions.IgnoreCase);
            Console.WriteLine(s);
            Console.ReadLine();
        }

        
private static string CorrectString(Match match)
        
{
            
string matchValue = match.Value;
            
if(matchValue.Length == 1)
                matchValue 
= "0" + matchValue;
            
return matchValue;
        }

以上这段代码说明了如果使用delegate MatchEvaluator 来处理正则的Match结果,该代码返回"01 12 03 05"Replace方法除了使用delegate来处理捕获的Match,还可以用字符串来替换Match的结果,而用字符串来替换Match结果除了把Match结果静态的替换成一个固定的文本外,还可以使用以下语法来更方便的实现你需要的功能:

$number

把匹配的第number组替换成替换表达式,还有这句话怎么写也表达不清楚意思,还是来个例子吧:

        public static void Main()
        
{    
            
string s = "1 12 3 5";
            s 
= Regex.Replace(s,@"(\d+)(?#这个是注释)","0$1",RegexOptions.Compiled|RegexOptions.IgnoreCase);
            Console.WriteLine(s);
            Console.ReadLine();
        }

这段代码返回的是 01 012 03 05

就是说,对组一的每个匹配结果都用"0$1"这个表达式来替换,"0$1""$1"由组1匹配的结果代入

${name}

把匹配的组名为"name"的组替换成表达式,

上例的Regex expression改成@"(?<name>\d+)(?#这个是注释)"后面的替换式改为"0${name}"结果是一样的

$$  

$的转义符,如上例表达式改成@"(?<name>\d+)(?#这个是注释)""$$${name}",则结果为"$1 $12 $3 $5"

$&

替换整个匹配

$`

替换匹配前的字符

$'

替换匹配后的字符

$+

替换最后匹配的组

$_

替换整个字符串

后面的选项,大家自己写个例子体味一下。

*,上例中的(?#这个是注释)说明了正则的内联注释语法为(?#)


表达项选项

正则表达式选项RegexOptions有如下一下选项,详细说明请参考联机帮助

RegexOptions枚举值

内联标志

简单说明

ExplicitCapture

n

只有定义了命名或编号的组才捕获

IgnoreCase

i

不区分大小写

IgnorePatternWhitespace

x

消除模式中的非转义空白并启用由 # 标记的注释。

MultiLine

m

多行模式,其原理是修改了^$的含义

SingleLine

s

单行模式,和MultiLine相对应

这里我提到内联标志,是因为相对于用RegexOptionsnew Regex时定义Regex表达式的全局选项来说,内联标志可以更小粒度(以组为单位)的定义匹配选项,从而更方便表达我们的思想

语法是这样的:(?i:expression)为定义一个选项,(?-i:expression)为删除一个选项,(?i-s:expression)则定义i,删除s,是的,我们可以一次定义很多个选项。这样,通过内联选项,你就可以在一个Regex中定义一个组为匹分大小写的,一个组不匹分大小写的,是不是很方便呢?

更多精彩内容,请看下回分解,

下一篇:.net中的正则表达式使用高级技巧 (二)  
                .net中的正则表达式使用高级技巧 (三) 
                .net中的正则表达式使用高级技巧 (四)

posted @ 2006-02-28 09:20 Lyn 阅读(9942) 评论(27)  编辑 收藏 所属分类: Regex expression

  回复  引用  查看    
#1楼 2006-02-28 09:44 | Terrylee      
不错,支持写完!
我也想好好学习一下正则:)
  回复  引用  查看    
#2楼 [楼主]2006-02-28 09:54 | THIN      
我想本文还是值得想学正则的朋友认真一看的,特别是第三篇讲反向引用,正声明,负声明,正反声明,负反声明,非回溯匹配时都是我大量实践得出的真知。
  回复  引用    
#3楼 2006-02-28 10:43 | isonny [未注册用户]
支持,我一直没有搞明白这个正则
  回复  引用  查看    
#4楼 [楼主]2006-02-28 11:46 | THIN      
to Terrylee
每天发一篇
  回复  引用  查看    
#5楼 2006-02-28 12:06 | 木野狐      
呵呵,非常期待。
希望楼主能写出“控件开发系列”一样精彩的第二个系列文章 :D
  回复  引用  查看    
#6楼 [楼主]2006-02-28 12:33 | THIN      
to 木野狐
谢谢,这个系列很小的,不能和“控件开发”这样的主题比,控件开发系列我会在对asp.net2.0进行了研究之后再继续写下去的。
  回复  引用    
#7楼 2006-02-28 13:15 | 光杆兵 [未注册用户]
搂主写得不错,支持。

前一段时间我也写过一篇,讲的内容更简单一些,希望能跟搂主多多交流:
http://www.regexlab.com/zh/regref.htm

顺便请教一下搂主:
.NET 的正则表达式能不能支持递归匹配?
  回复  引用    
#8楼 2006-02-28 13:20 | ddddd [未注册用户]
fgfggggggggggggggg
  回复  引用  查看    
#9楼 [楼主]2006-02-28 14:04 | THIN      
关于正则式的递归匹配,请尝试使用MatchEvaluator委拖
  回复  引用  查看    
#10楼 2006-02-28 14:38 | C# hack      
我爱正则!
  回复  引用  查看    
#11楼 2006-02-28 15:23 | xiao_p      
可以把网页特效去掉不? 看起来感觉真的很不舒服……


  回复  引用    
#12楼 2006-03-01 16:15 | 忍渣 [未注册用户]
不错,继续!
  回复  引用  查看    
#13楼 2006-03-03 16:04 | coolstr[占卜師oοΟ]      
THIN , 最近在研究 正则 这个好东东啦?俺有空多来逛逛才行,学点东东。
  回复  引用  查看    
#14楼 2006-03-06 15:34 | Dot.net德仔      
我顶一下.
  回复  引用  查看    
#15楼 2006-03-07 18:04 | 仁面寿星      
又学到好多东西,非常谢谢,对于不厚道的人,坚决鄙视。
  回复  引用    
#16楼 2006-03-27 16:24 | sdf [未注册用户]
123123123
  回复  引用    
#17楼 2006-07-21 15:48 | winds [未注册用户]
太好了
刚想学点正则就遇到那么好的东东!!~~感谢楼主
  回复  引用    
#18楼 2006-08-10 12:06 | Diffmaker [未注册用户]
这么好的文章,不顶对不起。
  回复  引用  查看    
#19楼 2006-09-07 15:11 | 壮志      
Replace方法很好用,免去了把匹配到的值循环处理的麻烦。
  回复  引用    
#20楼 2007-03-24 20:55 | 釜底抽薪 [未注册用户]
谢谢。很有帮助
  回复  引用    
#21楼 2007-04-16 15:34 | baogc [未注册用户]
好文章,顶一下
  回复  引用  查看    
#22楼 2007-08-21 21:49 | 空间/IV      
学习ing。
  回复  引用    
#23楼 2007-08-23 15:00 | zyhomepage [未注册用户]
不错!我也学习了!
  回复  引用    
#24楼 2007-09-10 12:05 | YuLa [未注册用户]
不错啊!
  回复  引用  查看    
#25楼 2008-08-05 17:17 | b4n73      
--引用--------------------------------------------------
THIN: to 木野狐
<br>谢谢,这个系列很小的,不能和“控件开发”这样的主题比,控件开发系列我会在对asp.net2.0进行了研究之后再继续写下去的。
--------------------------------------------------------
谢谢

标题  
姓名  
主页
Email (博主才能看到) 
验证码 *  看不清,换一张 [登录][注册]
内容(请不要发表任何与政治相关的内容)  
  登录  使用高级评论  新用户注册  返回页首  恢复上次提交      
该文被作者在 2006-03-03 09:40 编辑过
"五向定位"职业成长路线公开课(上海、南京、大连)
Google站内搜索


相关链接: