第5章正则的扩展

5.1 RegExp构造函数

在 ES5 中，RegExp 构造函数的参数有两种情况。

第一种情况是，参数是字符串，这时第二个参数表示正则表达式的修饰符（flag）。

var hzh1 = new RegExp('xyz', 'i');
console.log("输出hzh1：");
console.log(hzh1);
// 等价于
console.log("");
var hzh2 = /xyz/i;
console.log("输出hzh2：");
console.log(hzh2);

[Running] node "e:\HMV\Babel\hzh.js"
输出hzh1：
/xyz/i

输出hzh2：
/xyz/i

[Done] exited with code=0 in 0.289 seconds

第二种情况是，参数是一个正则表示式，这时会返回一个原有正则表达式的拷贝。

var hzh1 = new RegExp(/xzy/i);
console.log("输出变量hzh1：");
console.log(hzh1);
console.log("");
// 等价于
var hzh2 = /xzy/i;
console.log("输出变量hzh2：");
console.log(hzh2);

[Running] node "e:\HMV\Babel\hzh.js"
输出变量hzh1：
/xzy/i

输出变量hzh2：
/xzy/i

[Done] exited with code=0 in 0.197 seconds

但是，ES5 不允许此时使用第二个参数添加修饰符，否则会报错。

var hzh = new RegExp(/xyz/, 'i');
// Uncaught TypeError: Cannot supply flags
// when constructing one RegExp from another

ES6 改变了这种行为。如果 RegExp 构造函数第一个参数是一个正则对象，那么可以使用第二个参数指定修饰符。而且，返回的正则表达式会忽略原有正则表达式的修饰符，只使用新指定的修饰符。

var hzh = new RegExp(/hzh/ig, 'i').flags;
console.log("输出变量hzh：");
console.log(hzh);

[Running] node "e:\HMV\Babel\hzh.js"
输出变量hzh：
i

[Done] exited with code=0 in 0.21 seconds

上面的代码中，原有正则对象的修饰符是 ig，它会被第二个参数 i 覆盖。

5.2 字符串的正则方法

字符串对象共有 4 个方法可以使用正则表达式：match（）、replace（）、search（）和 split（）。

ES6 使这 4 个方法在语言内部全部调用 RegExp 的实例方法，从而做到所有与正则相关的方法都定义在 RegExp 对象上。

String.prototype.match 调用 RegExp.prototype[Symbol.match]

String.prototype.replace 调用 RegExp.prototype[Symbol.replace]

String.prototype.search 调用 RegExp.prototype[Symbol.search]

String.prototype.split 调用 RegExp.prototype[Symbol.split]

5.3 u修饰符

ES6 对正则表达式添加了 u 修饰符，含义为 “Unicode模式”，用来正确处理大于 \uFFFF 的 Unicode 字符。也就是说，可以正确处理4个字节的 UTF-16 编码。

var hzh1 = /^\uD83D/u.test('\uD83D\uDC2A');
console.log('输出变量hzh1');
console.log(hzh1);
console.log('');
var hzh2 = /^uD83D/.test('\uD83D\uDC2A');
console.log('输出变量hzh2：');
console.log(hzh2);

[Running] node "e:\HMV\Babel\hzh.js"
输出变量hzh1
false

输出变量hzh2：
false

[Done] exited with code=0 in 0.179 seconds

上面的代码中，\uD83D\uDC2A 是一个 4 字节的 UTF-16 编码，代表一个字符。但是，ES5 不支持 4 字节的 UTF-16 编码，会将其识别为 2 个字符，导致第二行代码结果为 true 。加了 u 修饰符以后，ES6 就会识别其为一个字符，所以第一行代码结果为 false 。

一旦加上 u 修饰符，就会修改下面这些正则表达式的行为。

点字符

点（.）字符在正则表达式中的含义是除换行符以外的任意单个字符。对于码点大于 0xFFFF 的 Unicode 字符，点字符不能识别，必须加上u修饰符。

5.4 y修饰符

5.5 sticky属性

5.6 flags属性

5.7 s修饰符：dotAll模式

5.8 后行断言

5.9 Unicode属性类

5.10 具名组匹配

5.10.1 简介

5.10.2 解构赋值和替换

5.10.3 引用

posted @ 2022-05-14 13:55 黄子涵阅读(49) 评论(0) 收藏举报

刷新页面返回顶部

第5章 正则的扩展

5.1 RegExp构造函数

5.2 字符串的正则方法

5.3 u修饰符

点字符

5.4 y修饰符

5.5 sticky属性

5.6 flags属性

5.7 s修饰符：dotAll模式

5.8 后行断言

5.9 Unicode属性类

5.10 具名组匹配

5.10.1 简介

5.10.2 解构赋值和替换

5.10.3 引用

公告

第5章正则的扩展