Microsoft Rex 正则表达式工具

     前一阵为了查找HTML 中字符内容需要使用正则表达式,无意中在Channel9 上看到一个关于正则表达式的视频,介绍了出自Microsoft Research 的Rex(Regular Expression Exploration)工具。Rex 是一个简单的命令行工具,将用户输入的.NET 正则表达式模型自动生成相符合的字符串。同时Rex 还支持API 调用,运行速度也很快。

Rex 是如何工作的

1. 首先将用户的正则表达式模型翻译为Symbolic Finite Automaton(符号型有限机器人)。例如正则表达式:^[0-9]{2,}$  意为:以0~9之间的数字开头,重复2次或更多次,并以0~9之间的数字作为结尾的一组数。该表达式将被翻译为下图SFA:

SFA

2. 再由约束求解器(Constraint Solver )生成相应的字符串成员。

Rex 应用实例

1. 下载Rex 工具 http://research.microsoft.com/en-us/downloads/7f1d87be-f6d9-495d-a699-f12599cea030/

2. 解压后运行Rex.exe 可浏览相关帮助信息:

RexHelp

3. 将^[0-9]{2,}$ 表达式通过Rex 生成10组数据:

RexTest

posted @ 2010-04-17 09:42  Gnie  阅读(6465)  评论(40编辑  收藏  举报
Copyright © 2010 Gnie