javascript正则表达式——语法

js中正则表达式，是处理字符优先考虑用的，从三个部分来讲分别是语法、js函数、常用例子，组成正则三部曲。

\：转义字符。'\\n'匹配\n

^：开始位置。'^[0-9]'匹配以数字开头的字符，可以匹配'88DC'，不可匹配'DC88'

$：结束位置。'[0-9]$'匹配以数字结尾的字符，可以匹配'ab12',不可以匹配'12ab'

*：匹配前面的子表达式任意次。'abcd*'匹配带有abc加任意个d的字符，可以匹配'hi abc'、'hi abcddddd'，不可以匹配'hi ab'

+：匹配前面的子表达式一次或多次。'abcd+'匹配带有abc加一个以上d的字符，匹配'abcddd**abcd**abc'，得出["abcddd", "abcd"]

?：匹配前面的子表达式零次或一次。'abcd+'匹配带有abc加零个或一个d的字符，匹配'abcddd**abcd**abc'，得出["abcd", "abcd", "abc"]

{n}：n是非负整数，匹配n次。'zoo{2}'匹配带有zo加两个'oo'的字符，匹配'zooooo'，得出["zooo"]

{n,}：n是非负整数，至少匹配n次。'zoo{2,}'匹配带有zo加两个'oo'的字符，匹配'zooooo'，得出["zooooo"]

{n,m}：n和m非负整数，n<=m，匹配至少n，最多m次。'fo{2,4}d'匹配f和d之间2~4个o，可以匹配'fooood'，得出["fooood"]

x|y：匹配x或y。例如，“z|food”能匹配“z”或“food”(此处请谨慎)。“(z|f)ood”则匹配“zood”或“food”。

[xyz]：字符集合。匹配所包含的任意一个字符。例如，“[abc]”可以匹配“plain”中的“a”。

[^xyz]：负值字符集合。匹配未包含的任意字符。例如，“[^abc]”可以匹配“plain”中的“plin”。

[a-z]：字符范围。匹配指定范围内的任意字符。例如，“[a-z]”可以匹配“a”到“z”范围内的任意小写字母字符。

[^a-z]：负值字符范围。匹配任何不在指定范围内的任意字符。例如，“[^a-z]”可以匹配任何不在“a”到“z”范围内的任意字符。

\b：匹配一个单词边界，也就是指单词和空格间的位置（即正则表达式的“匹配”有两种概念，一种是匹配字符，一种是匹配位置，这里的\b就是匹配位置的）。例如，“er\b”可以匹配“never”中的“er”，但不能匹配“verb”中的“er”。例子

const capitalizeEveryWord = str => str.replace(/\b[a-z]/g, char => char.toUpperCase());
capitalizeEveryWord('hello world!')    ->'Hello World!'

\B：匹配非单词边界。“er\B”能匹配“verb”中的“er”，但不能匹配“never”中的“er”。

\d：匹配一个数字字符。等价于[0-9]。

\D：匹配一个非数字字符。等价于[^0-9]。

\n：匹配一个换行符。

\r：匹配一个回车符。

\s：匹配任何不可见字符，包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。（指换页、换行、回车、制表、垂直制表）。

\S：匹配任何可见字符。等价于[^ \f\n\r\t\v]。

\w：匹配包括下划线的任何单词字符。类似但不等价于“[A-Za-z0-9_]”，这里的"单词"字符使用Unicode字符集。

\W：匹配任何非单词字符。等价于“[^A-Za-z0-9_]”。

< >：匹配词（word）的开始（<）和结束（>）。例如正则表达式<the>能够匹配字符串"for the wise"中的"the"，但是不能匹配字符串"otherwise"中的"the"。注意：这个元字符不是所有的软件都支持的。

( )：将( 和 ) 之间的表达式定义为“组”（group）。例如用(the)(\d){3,}([a-z])匹配 "the12345hi12345"得出，["the12345h", "the", "5", "h"]。

posted @ 2016-09-02 11:05 简惬阅读(373) 评论(0) 收藏举报

刷新页面返回顶部

简惬