JavaScript RegExp对象的exec()方法

JavaScript RegExp对象的exec()方法用来匹配字符串，它的行为与match()有些不同。

对于RegExpObject.exec()，w3school上面是这样介绍的：

exec() 方法的功能非常强大，它是一个通用的方法，而且使用起来也比 test() 方法以及支持正则表达式的 String 对象的方法更为复杂。

如果 exec() 找到了匹配的文本，则返回一个结果数组。否则，返回 null。此数组的第 0 个元素是与正则表达式相匹配的文本，第 1 个元素是与 RegExpObject 的第 1 个子表达式相匹配的文本（如果有的话），第 2 个元素是与 RegExpObject 的第 2 个子表达式相匹配的文本（如果有的话），以此类推。除了数组元素和 length 属性之外，exec() 方法还返回两个属性。index 属性声明的是匹配文本的第一个字符的位置。input 属性则存放的是被检索的字符串 string。我们可以看得出，在调用非全局的 RegExp 对象的 exec() 方法时，返回的数组与调用方法 String.match() 返回的数组是相同的。

但是，当 RegExpObject 是一个全局正则表达式时，exec() 的行为就稍微复杂一些。它会在 RegExpObject 的 lastIndex 属性指定的字符处开始检索字符串 string。当 exec() 找到了与表达式相匹配的文本时，在匹配后，它将把 RegExpObject 的 lastIndex 属性设置为匹配文本的最后一个字符的下一个位置。这就是说，您可以通过反复调用 exec() 方法来遍历字符串中的所有匹配文本。当 exec() 再也找不到匹配的文本时，它将返回 null，并把 lastIndex 属性重置为 0。

RegExp对象的exec()方法与String对象的match()方法很容易混淆，String.match()方法是这样的：

match() 方法将检索字符串 stringObject，以找到一个或多个与 regexp 匹配的文本。这个方法的行为在很大程度上有赖于 regexp 是否具有标志 g。

如果 regexp 没有标志 g，那么 match() 方法就只能在 stringObject 中执行一次匹配。如果没有找到任何匹配的文本， match() 将返回 null。否则，它将返回一个数组，其中存放了与它找到的匹配文本有关的信息。该数组的第 0 个元素存放的是匹配文本，而其余的元素存放的是与正则表达式的子表达式匹配的文本。除了这些常规的数组元素之外，返回的数组还含有两个对象属性。index 属性声明的是匹配文本的起始字符在 stringObject 中的位置，input 属性声明的是对 stringObject 的引用。

如果 regexp 具有标志 g，则 match() 方法将执行全局检索，找到 stringObject 中的所有匹配子字符串。若没有找到任何匹配的子串，则返回 null。如果找到了一个或多个匹配子串，则返回一个数组。不过全局匹配返回的数组的内容与前者大不相同，它的数组元素中存放的是 stringObject 中所有的匹配子串，而且也没有 index 属性或 input 属性。

注意：在全局检索模式下，match() 即不提供与子表达式匹配的文本的信息，也不声明每个匹配子串的位置。如果您需要这些全局检索的信息，可以使用 RegExp.exec()。

总结下来有几点注意事项：

1. lastIndex属性

如果RegExpObject.exec()中的RegExpObject是全局模式时，lastIndex在每次匹配过后，会被设置为匹配的最后一个字符的下一个位置。

顺带一句，RegExp对象的exec()方法和test()方法都有这个问题：如果该RegExp对象有标志g或者是全局模式，lastIndex的值是下次匹配的起点。如果在一次匹配后要开始检索新的字符串，必须手动把lastIndex置为0。

String.match()方法不存在这个问题。

2. 非全局模式

非全局模式下，exec()方法与match()方法的表现是一样的。结果是一个数组，第0个元素是匹配的文本，其余的元素是与子表达式（带括号的）匹配的文本，以及两个属性index和input。

var reg = /(do[gp])/;
var str = 'dog dopg';

console.log(reg.exec(str)); // ["dog", "dog", index: 0, input: "dog dopg"]
console.log(str.match(reg)); // ["dog", "dog", index: 0, input: "dog dopg"]

3. 全局模式

全局模式下，exec()方法从lastIndex处开始匹配字符串，一旦匹配成功则返回结果数组，并不继续进行后面匹配，同时修改lastIndex属性。

而match()方法会返回所有匹配结果组成的一个数组。

既然match()方法可以直接返回一个匹配结果数组，而exec()方法只返回了第一个，那为什么还需要exec()方法？

看下面代码：

var reg = /do([gp])/g;
var str = 'dog dopg';

console.log(reg.exec(str), reg.exec(str)); // ["dog", "g", index: 0, input: "dog dopg"] ["dop", "p", index: 4, input: "dog dopg"]
console.log(str.match(reg)); // ["dog", "dop"]

在全局模式下，可以通过多次调用exec()方法，来获取每一个匹配文本，并且可以获得每个的子表达式匹配的文本，同时还有每个lastIndex，match()方法无法做到。

最后引用w3school里面的文字作为总结：

请注意，无论 RegExpObject 是否是全局模式，exec() 都会把完整的细节添加到它返回的数组中。这就是 exec() 与 String.match() 的不同之处，后者在全局模式下返回的信息要少得多。因此我们可以这么说，在循环中反复地调用 exec() 方法是唯一一种获得全局模式的完整模式匹配信息的方法。

posted @ 2014-10-08 11:02 赵东禹阅读(1580) 评论(0) 收藏举报

刷新页面返回顶部

赵东禹's blog

Old soldiers never die, they just fade away.

JavaScript RegExp对象的exec()方法

公告