正则表达式
1. 正则表达式概述
1.1 什么是正则表达式
正则表达式( Regular Expression )是用于匹配字符串中字符组合的模式。在JavaScript中,正则表达式也是对象
正则表通常被用来检索、替换那些符合某个模式(规则)的文本,如验证表单:用户名表单只能输入英文字母、数字或者下划线, 昵称输入框中可以输入中文(匹配)
此外,正则表达式还常用于过滤掉页面内容中的一些敏感词(替换),或从字符串中获取想要的特定部分(提取)等
1.2 正则表达式的特点
-
灵活性、逻辑性和功能性非常的强
-
可以迅速地用极简单的方式达到字符串的复杂控制
-
实际开发,一般都是直接复制写好的正则表达式,但是要求会使用正则表达式并且根据实际情况修改正则表达式
2. 正则表达式在 js 中的使用
2.1 正则表达式的创建
- 通过调用
RegExp
对象的构造函数创建
var regexp = new RegExp(/123/);
console.log(regexp);
- 利用
/ /
字面量创建正则表达式
var rg = /123/;
2.2 测试正则表达式
正则对象方法,用于检测字符串是否符合该规则
语法:正则表达式.test(字符串)
返回:布尔值
var reg = /123/;
console.log(reg.test(123)); // true
console.log(reg.test('abc')); // false
3. 正则表达式中的特殊字符
3.1 正则表达式的组成
它可由简单的字符构成,如: /abc/
,也可以是简单和特殊字符的组合,如: /ab*c/
其中特殊字符也称为元字符,是具有特殊意义的专用符号,如: ^
、$
、+
等
特殊字符非常多,可以参考:MDN
jQuery 手册:正则表达式部分
3.2 边界符
正则表达式中的边界符(位置符)用来提示字符所处的位置
边界符 | 说明 |
---|---|
^ | 匹配行首的文本(输入的开始) |
$ | 匹配行尾的文本(输入的结束) |
如果 ^
和 $
在一起,表示必须是精确匹配
var r1 = /abc/; // 只要包含有 abc 的字符返回都是 true
var r2 = /^abc/; // 必须以 abc 开头才为真
var r3 = /^abc$/; // 精确匹配,必须是 abc 才为真
注意:正则表达式里面不需要加引号,不管是数字型还是字符串型
3.3 方括号
所有可供选择的字符都放在方括号内,只匹配其中一个(多选一)
var r1 = /[abc]/; // 只要包含有方括号内任何一个字符都为真
var r2 = /^[abc]$/; // 必须是方括号内任何一个字符才为真(三选一)
var r3 = /^[a-z]$/; // 26个小写英文字母任意一个都为真(a到z选一)
var r4 = /^[a-zA-Z0-9_-]$/; // 字符组合
// 26个英文字母(大小写都可)0到9数字还有下划线和短横线,是任何一个都为真
var r5 = /^[^a-zA-Z0-9_-]$/; // 排除方括号内这些字符任意一个字符都可以
注意:方括号内头部加 ^
表示取反,排除这些字符,千万和边界符 ^ 别混淆
3.4 量词符
量词符用来设定某个模式出现的次数
量词 | 说明 |
---|---|
* | 出现 0 次或更多次 |
+ | 出现 1 次或更多次 |
? | 出现 0 次或 1 次 |
出现 n 次 | |
出现 n 次或更多次 | |
出现 n 到 m 次 |
例:var r = /^a{3,9}$/;
(精确匹配长度大于等于 3 次并且 小于等于 9 次的 a)
console.log(r.test('aaaaaa')); // true
console.log(r.test('aaabaaa')); // false
console.log(r.test('aa')); // false
3.5 用户名表单验证
功能需求:
- 如果用户名输入合法, 则后面提示信息为: 用户名合法,并且颜色为绿色
- 如果用户名输入不合法, 则后面提示信息为: 用户名不符合规范, 并且颜色为红色
分析:
- 用户名只能为英文字母,数字,下划线或者短横线组成, 并且用户名长度为6~16位.
- 首先准备好这种正则表达式模式/$[a-zA-Z0-9-_]{6,16}^/
- 当表单失去焦点就开始验证
- 如果符合正则规范, 则让后面的span标签添加 right类
- 如果不符合正则规范, 则让后面的span标签添加 wrong类
3.6 括号总结
- 大括号:量词符,里面表示出现的次数
- 中括号:字符集合,匹配方括号中的任意字符
- 小括号:表示优先级最高
3.7 预定义类
预定义类指的是某些常见模式的简写方式
预定义类 | 说明 |
---|---|
\d | 匹配 0-9 之间的任一数字,相当于[0-9] |
\w | 匹配任意的字母、数字和下划线,相当于 [A-Za-z0-9] |
\s | 匹配空格(包括换行符、制表符、空格符等)相等于 [\t\r\n\v\f] |
注意:大写代表取反、排除。如:\D
表示匹配除了0-9以外的字符 [^0-9]
3.8 正则替换 replace
该方法可以实现替换字符串操作,用来替换的参数可为一个字符串或是一个正则表达式
- 全部替换:
g
- 忽略大小写:
i
- 多行模式:
m
- 匹配所有:
s
(除了空格\n
外所有) - 全部替换并且忽略大小写:
gi
文章版权归作者所有,未经允许请勿转载。