正则
- 部分范围:
[a-f]
,匹配 a 到 f 的任意字符。 - 小写范围:
[a-z]
,匹配 a 到 z 的任意字符。 - 大写范围:
[A-Z]
,匹配 A 到 Z 的任意字符。 - 数字范围:
[0-9]
,匹配 0 到 9 的任意字符。 - 符号范围:
[#$%&@]
。 - 混合范围:
[a-zA-Z0-9]
,匹配所有数字、大小写字母中的任意字符。
3. 数量字符
如果想要匹配三个字母的单词,根据上面我们学到的字符范围,可以这样来写:a-z][a-z][a-z]
其实匹配重复字符的完整语法是这样的:{m,n}
,它会匹配前面一个字符至少 m 次至多 n 次重复,{m}表示匹配 m 次,{m,}表示至少 m 次。
除了可以使用大括号来匹配一定数量的字符,还有三个相关的模式:
-
+
:匹配前面一个表达式一次或者多次,相当于{1,}
。 -
*
:匹配前面一个表达式0次或者多次,相当于{0,}
。 -
?
:单独使用匹配前面一个表达式零次或者一次,相当于{0,1}
,如果跟在量词*、+、?、{}后面的时候将会使量词变为非贪婪模式(尽量匹配少的字符),默认是使用贪婪模式。
来看一个简单的例子,这里我们匹配的正则表达式为/a+/ig
,
它和/a{1,}/ig
的匹配结果是一样的
使用/[a-z]+/ig
就可以匹配任意长度的纯字母单词:
4、元字符
使用元字符可以编写更紧凑的正则表达式模式。常见的元字符如下:
-
\d
:相当于[0-9]
,匹配任意数字。 -
\D
:相当于[^0-9]
。 -
\w
:相当于[0-9a-zA-Z]
,匹配任意数字、大小写字母和下划线。 -
\W
:相当于:[^0-9a-zA-Z]。 -
\s
:相当于[\t\v\n\r\f]
,匹配任意空白符,包括空格,水平制表符\t
,垂直制表符\v
,换行符\n
,回车符\r
,换页符\f
。 -
\S
:相当于[^\t\v\n\r\f]
,表示非空白符。 -
5、特殊字符
使用特殊字符可以编写更高级的模式表达式,常见的特殊字符如下:
-
.
:匹配除了换行符之外的任何单个字符。 -
\
:将下一个字符标记为特殊字符、或原义字符、或向后引用、或八进制转义符。 -
|
:逻辑或操作符。 -
[^]
:取非,匹配未包含的任意字符。
来看一个简单的例子,如果我们使用
/ab*/ig
进行匹配 -
- 或匹配也很简单,来看例子,匹配规则为:
/ab|cd/ig
-
这里就会匹配到字符串中所有
ab
和 cd
字符。那如果想要匹配 sabz
或者scdz
呢?开头和结尾是相同的,只有中间的两个字符是可选的。其实只需要给中间的或部分加上括号就可以了: -
、位置匹配
如果我们想匹配字符串中以某些字符结尾的单词,以某些字符开头的单词该如何实现呢?正则表达式中提供了方法通过位置来匹配字符:
-
\b
:匹配一个单词边界,也就是指单词和空格间的位置。 -
\B
:匹配非单词边界。 -
^
:匹配开头,在多行匹配中匹配行开头。 -
$
:匹配结尾,在多行匹配中匹配行结尾。 -
(?=p)
:匹配 p 前面的位置。 -
(?!=p)
:匹配不是 p 前面的位置。
最常见的就是匹配开始和结束位置。先来看一个开始位置的匹配,这里使用
/^ex/igm
来匹配多行中以ex
开头的行: -
-
需要注意,这里我们都使用
m
修饰符开启了多行模式。使用
/(?=the)/ig
来匹配字符串中the
前的面的位置 -
四、修饰符
正则表达式常见的修饰符如下:
-
g
:表示全局模式,即运用于所有字符串。 -
i
:表示不区分大小写,即匹配时忽略字符串的大小写。 -
m
:表示多行模式,强制 $ 和 ^ 分别匹配每个换行符。 -
1、实例方法
RegExp 实例置了
test()
和exec()
这两个方法来校验正则表达式。下面来分别看一下这两个方法。(1)test()
test()
用于检测一个字符串是否匹配某个模式,如果字符串中含有匹配的文本,则返回 true,否则返回 false。const regex1 = /a/ig; const regex2 = /hello/ig; const str = "Action speak louder than words"; console.log(regex1.test(str)); // true console.log(regex2.test(str)); // false
- 1.
- 2.
- 3.
- 4.
- 5.
(2)exec()
exec()
用于检索字符串中的正则表达式的匹配。该函数返回一个数组,其中存放匹配的结果。如果未找到匹配,则返回值为 null。const regex1 = /a/ig; const regex2 = /hello/ig; const str = "Action speak louder than words"; console.log(regex1.exec(str)); // ['A', index: 0, input: 'Action speak louder than words', groups: undefined] console.log(regex2.exec(str)); // null
- 1.
- 2.
- 3.
- 4.
- 5.
在当在全局正则表达式中使用
exec
时,每隔一次就会返回null
,如图:这是怎么回事呢?MDN 的解释如下:
在设置了 global 或 sticky 标志位的情况下(如 /foo/g or /foo/y),JavaScript RegExp 对象是有状态的。他们会将上次成功匹配后的位置记录在 lastIndex 属性中。使用此特性,exec() 可用来对单个字符串中的多次匹配结果进行逐条的遍历(包括捕获到的匹配),而相比之下, String.prototype.match() 只会返回匹配到的结果。
为了解决这个问题,我们可以在运行每个exec命令之前将
lastIndex
赋值为 0:2、实例属性
RegExp实例还内置了一些属性,这些属性可以获知一个正则表达式的各方面的信息,但是用处不大。
属性
描述
global
布尔值,表示是否设置了g标志
ignoreCase
布尔值,表示是否设置了i标志
lastIndex
整数,表示开始搜索下一个匹配项的字符位置,从0算起
multiline
布尔值,表示是否设置了m标志
source
正则表达式的字符串表示,按照字面量形式而非传入构造函数重大的字符串模式匹配
六、字符串方法
在 JavaScript 中有6种常用的方法是支持正则表达式的,下面来分别看看这些方法。
1、search()
search()
方法用于检索字符串中指定的子字符串,或检索与正则表达式相匹配的子字符串,并返回子串的起始位置。如果没有找到任何匹配的子串,则返回 -1。const regex1 = /a/ig; const regex2 = /p/ig; const regex3 = /m/ig; const str = "Action speak louder than words"; console.log(str.search(regex1)); // 输出结果:0 console.log(str.search(regex2)); // 输出结果:8 console.log(str.search(regex3)); // 输出结果:-1
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
- 7.
可以看到,
search()
方法只会返回匹配到的第一个字符的索引值,当没有匹配到相应的值时,就会返回-1。2、match()
match()
方法可在字符串内检索指定的值,或找到一个或多个正则表达式的匹配。如果没有找到任何匹配的文本, match()
将返回 null
。否则,它将返回一个数组,其中存放了与它找到的匹配文本有关的信息。const regex1 = /a/ig; const regex2 = /a/i; const regex3 = /m/ig; const str = "Action speak louder than words"; console.log(str.match(regex1)); // 输出结果:['A', 'a', 'a'] console.log(str.match(regex2)); // 输出结果:['A', index: 0, input: 'Action speak louder than words', groups: undefined] console.log(str.match(regex3)); // 输出结果:null
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
- 7.
可以看到,当没有
g
修饰符时,就只能在字符串中执行一次匹配,如果想要匹配所有符合条件的值,就需要添加 g
修饰符。3、matchAll()
matchAll()
方法返回一个包含所有匹配正则表达式的结果及分组捕获组的迭代器。因为返回的是遍历器,所以通常使用for...of
循环取出。for (const match of 'abcabc'.matchAll(/a/g)) { console.log(match) } //["a", index: 0, input: "abcabc", groups: undefined] //["a", index: 3, input: "abcabc", groups: undefined]
- 1.
- 2.
- 3.
- 4.
- 5.
需要注意,该方法的第一个参数是一个正则表达式对象,如果传的参数不是一个正则表达式对象,则会隐式地使用
new RegExp(obj)
将其转换为一个 RegExp
。另外,RegExp必须是设置了全局模式g
的形式,否则会抛出异常 TypeError
。4、replace()
replace()
用于在字符串中用一些字符串替换另一些字符串,或替换一个与正则表达式匹配的子串。const regex = /A/g; const str = "Action speak louder than words"; console.log(str.replace(regex, 'a')); // 输出结果:action speak louder than words
- 1.
- 2.
- 3.
可以看到,第一个参数中的正则表达式匹配到了字符串的第一个大写的 A,并将其替换为了第二个参数中的小写的 a。
5、replaceAll()
replaceAll()
方法用于在字符串中用一些字符替换另一些字符,或替换一个与正则表达式匹配的子串,该函数会替换所有匹配到的子字符串。const regex = /a/g; const str = "Action speak louder than words"; console.log(str.replaceAll(regex, 'A')); // 输出结果:Action speAk louder thAn words
- 1.
- 2.
- 3.
需要注意,当使用一个
regex
时,您必须设置全局("g")标志, 否则,它将引发 TypeError
:"必须使用全局 RegExp 调用 replaceAll"。6、split()
split()
方法用于把一个字符串分割成字符串数组。其第一个参数是一个字符串或正则表达式,从该参数指定的地方分割字符串。const regex = / /gi; const str = "Action speak louder than words"; console.log(str.split(regex)); // 输出结果:['Action', 'speak', 'louder', 'than', 'words']
- 1.
- 2.
- 3.
这里的
regex
用来匹配空字符串,所以最终在字符串的每个空格处将字符串拆成了数组。七、实际应用
下面来通过正则表达式的几个实际应用来巩固一下上面的知识。
1、匹配密码
检查密码的格式,其包含至少一个大写字母、小写字母、数字、符号,长度为8-12位:
/^(?=.*[a-z])(?=.*[A-Z])(?=.*\d)(?=.*\W).{8,12}$/g
- 1.
这里我们主要使用了正则表达式中的正向前瞻,正向前瞻语法为
(?=pattern)
,即在目标字符串的相应位置必须有pattern
部分匹配的内容,但不作为匹配结果处理,更不会存储在缓冲区内供以后使用。来看一下这个正则表达式的每一部分的含义:-
(?=.*[a-z])
:匹配任何后面跟着小写字母的字符。 -
(?=.*[A-Z])
:匹配任何后面跟着大写字母的字符。 -
(?=.*\d)
:匹配任何后面跟着数字的字符。 -
(?=.*\W)
:匹配任何后面跟着符号的字符。 -
.{8,12}
:匹配的长度至少为 8 个字符,至多为12个字符。 -
^
和$
可以保证匹配从字符串的开头到结尾进行匹配,也就是只对整个密码进行匹配,不考虑部分匹配。
下面是测试结果:
2、匹配邮箱
检查电子邮箱的地址:
/^[a-zA-Z0-9.!#$%&'*+/=?^_`{|}~-]+@[a-zA-Z0-9-]+(?:\.[ a-zA-Z0-9-]+)*$/g
- 1.
下面来看一下这个正则表达式每一部分的含义:
-
^[a-zA-Z0-9.!#$%&'*+/=?^_
~-]+:检查是否使用了所有有效字符并且至少有了一个(末尾的
+`用于检查是否至少有一个字符)。 -
[a-zA-Z0-9-]+
:这一部分用来检验主机名是否有效,主机名可以是大小写字母、数字、中横线。最后的 + 表示至少有一位。 -
(?:\.[a-zA-Z0-9-]+)*
:这一部分是可选的域名后缀,这里使用的*
就表示前面的字符是0个或者多个,这样.com、.com.cn等域名都可以匹配到。 -
^
和$
可以保证匹配从字符串的开头到结尾进行匹配,也就是只对整个邮箱字符串进行匹配,不考虑部分匹配。
下面是测试结果:
3、匹配数字
检查数字是否是整数:
/^\d+$/
,其中\d+
表示至少有一位数字。测试结果如下:检查数字是否是小数:
/^\d*\.\d+$/
,其中\d*
表示至少有0位数字,\.
就是把小数点进行了转义操作,\d+
就表示至少有一位小数位。测试结果如下:校验一个数字是不是一个金额:
/^\d+(.\d{2})?$/
。八、实用工具
1、Regex101
Regex101 是学习正则表达式最有效的工具网站之一。在REGULAR EXPRESSION栏中可以输入正则表达式,可以在输入框右侧选择需要的修饰符,在下面的TEST STRING栏中输入要测试的字符串,即可显示出匹配到的结果。在右侧的EXPLANATION区域会显示出对输入的正则表达式的详细解释。右下角的 QUICK REFERENCE 栏会显示正则表达式速查表。
Regex101 还支持在上面练习编写正则表达式:
可以在上面搜索一些正则表达式的库:
除此之外,我们还可以使用 RegexDebugger 来跟踪匹配的过程。更多功能可以在Regex101 上进行探索。
官网:https://regex101.com/。
2、RegExr
RegExr 是一个基于 JavaScript 开发的在线工具,用来创建、测试和学习正则表达式。它是一个开源的工具,具有以下特性:
- 输入时,结果会实时更新。
- 支持 JavaScript 和 PHP/PCRE RegEx。
- 将匹配项或表达式移至详细信息。
- 保存并与他人共享表达式。
- 使用工具探索结果。
- 浏览参考以获取帮助和示例。
- 在编辑器中使用 cmd-Z/Y 撤消和重做。
- 官网:https://regexr.com/
3、Regex Pal
Regexpal 是一个基于 Javascript 的在线正则表达式验证工具。它的页面非常简洁,只有两个输入框,上面的输入框中可以输入正则表达式(匹配规则),下面的输入框可以输入待匹配的数据。此外,根据具体要求,还可以设置忽略大小写、多行匹配等参数。
官网:https://www.regexpal.com/、
4、Regex-Vis
Regex-Vis 是一个辅助学习、编写和验证正则的工具。它不仅能对正则进行可视化展示,而且提供可视编辑正则的能力。在输入一个正则表达式后,会生成它的可视化图形。然后可以点选或框选图形中的单个或多个节点,再在右侧操作面板对其进行操作,具体操作取决于节点的类型,比如在其右侧插入空节点、为节点编组、为节点增加量词等。
官网:https://regex-vis.com/。
5、Regex previewer
Regex previewer 是一个 VScode 插件,在插件市场搜索名称即可安装。当我们在编写正则表达式时,可以直接使用快捷键 Ctrl+Alt+M (windows)或者
⌥+⌘+M
(Mac)在编辑器右侧启动一个标签页,我们可以在这个标签页写一写测试用例,用来测试我们写的正则表达式,写完字符串用例之后,点击我们编写的正则表达式上方的 Test Regex...即可,这样右侧匹配到字符就会高亮显示了,如下图:
-