loadin Do…

一条只能往前走的路,叫时光.

首页 联系 订阅 管理

正则表达式的语法表   
    
【描述】
用特殊字符和序列,来为正则表达式书写模式。下面的表描述了这些字符,并包括了简短的例子,来说明如何使用这些字符。
________________________________________________________________
字符 | 描述
—————————————————————-
\ | 标记下一个字符是特殊字符或文字。例如,”n” 和字符 “n” 匹配。
| “\n” 则和换行字符匹配。序列 “\\” 和 “\” 匹配,而 “\(” 则
| 和 “(” 匹配。
—————————————————————-
^ | 匹配输入的开头。
—————————————————————-
$ | 匹配输入的末尾。
—————————————————————-
* | 匹配前一个字符零或多次。例如,”zo*” 与 “z” 或 “zoo” 匹配。
—————————————————————-
+ | 匹配前一个字符一次或多次。例如,”zo+” 与 “zoo” 匹配,但和 “z”
| 不匹配。
—————————————————————-
? | 匹配前一个字符零或一次。例如,”a?ve?” 和 “never” 中的 “ve” 匹
| 配。
—————————————————————–
. | 匹配除换行字符外的任何单个字符。
—————————————————————–
(pat- | 匹配 pattern 并记住该匹配。匹配上的子字符串,可以使用 Item
tern) | [0]…[n],来从生成的 Matches 集合中取回。要匹配圆括号字
| 符 ( ),则需使用 “\(” 或 “\)”。
—————————————————————–
x|y | 匹配 x 或 y。例如,”z|food” 和 “z” 或 “food” 匹配。”(z|f)
| ood” 匹配 “zoo” 或 “food”。
—————————————————————–
{n} | n 是非负整数。共匹配 n 次。例如,”o{2}” 和 “Bob” 中的 “o” 不匹
| 配,但和 “foooood” 中的前两个 o 匹配。
—————————————————————–
{n,} | n 是一个非负整数。至少匹配 n 次。例如,”o{2,}” 和 “Bob” 中
| 的 “o” 不匹配,但和 “foooood” 中的所有 o 匹配。”o{1,}”
| 与 “o+” 等效。”o{0,}” 和 “o*” 等效。
—————————————————————–
{n,m} | m 和 n 是非负整数。至少匹配 n 次而至多匹配 m 次。例如,”o
| {1,3}” 和 “fooooood” 中的前三个 o 匹配。”o{0,1}” 和 “o?” 等
| 效。
—————————————————————–
[xyz] | 字符集合。匹配括号内的任一字符。例如,”[abc]” 和 “plain” 中
| 的 “a” 匹配。
—————————————————————–
[^xyz]| 否定字符集合。匹配非括号内的任何字符。例如,”[^abc]”
| 和 “plain” 中的 “p” 匹配。
—————————————————————–
[a-z] | 字符范围。和指定范围内的任一字符匹配。例如,”[a-z]” 匹配 “a”
| 到 “z”范围内的任一小写的字母表字符。
—————————————————————–
[^m-z]| 否定字符范围。匹配不在指定范围内的任何字符。例如,”[m-z]” 匹配不
| 在 “m” 到 “z”范围内的任何字符。
—————————————————————–
\b | 匹配字的边界,也就是说,在字和空格之间的位置。例如,”er\b”
| 和 “never” 中的 “er” 匹配,但和 “verb” 中的 “er” 不匹配。
—————————————————————–
\B | 匹配非字边界。”ea*r\B” 和 “never early” 中的 “ear” 匹配。
—————————————————————–
\d | 匹配数字字符。等价于 [0-9]。
—————————————————————–
\D | 匹配非数字字符。等价于 [^0-9]。
—————————————————————–
\f | 匹配换页字符。
—————————————————————–
\n | 匹配换行字符。
—————————————————————–
\r | 匹配回车符字符。
—————————————————————–
\s |匹配任何空白,包括空格、制表、换页等。与 “[ \f\n\r\t\v]” 等效。
—————————————————————–
\S | 匹配任何非空白字符。与 “[^ \f\n\r\t\v]” 等效。
—————————————————————–
\t | 匹配制表字符。
—————————————————————–
\v | 匹配垂直制表符。
—————————————————————–
\w | 匹配包括下划线在内的任何字字符。与 “[A-Za-z0-9_]” 等效。
—————————————————————–
\W | 匹配任何非字字符。与 “[^A-Za-z0-9_]” 等效。
—————————————————————–
\num | 匹配 num,其中 num 是一个正整数。返回记住的匹配的引用。例
| 如,”(.)\1″ 匹配两个连续的同一字符。
—————————————————————–
\n | 匹配 n,其中 n 是八进制换码值。八进制换码值必须是 1、2、或 3 位
| 长。例如,”\11″ 和 “\011″ 都匹配制表字符。”\0011″ 和 “\001″
| & “1″ 是等效的。八进制换码值必须不超过 256。如果超过了,则只有
| 前两位组成表达式。允许在正则表达式中使用 ASCII 码。
—————————————————————–
\xn | 匹配 n,其中 n 是十六进制换码值。十六进制换码值必须正好是两位
| 长。例如,”\x41″ 与 “A” 匹配。”\x041″ 和 “\x04″ & “1″ 是等效
| 的。允许在正则表达式中使用 ASCII 码。
—————————————————————–

 

匹配中文字符的正则表达式: [\u4e00-\u9fa5]
评注:匹配中文还真是个头疼的事,有了这个表达式就好办了

匹配双字节字符(包括汉字在内):[^\x00-\xff]
评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)

匹配空白行的正则表达式:\n\s*\r
评注:可以用来删除空白行

匹配HTML标记的正则表达式:<(\S*?)[^>]*>.*?</\1>|<.*? />
评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力

匹配首尾空白字符的正则表达式:^\s*|\s*$
评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式

匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
评注:表单验证时很实用

匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*
评注:网上流传的版本功能很有限,上面这个基本可以满足需求

匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
评注:表单验证时很实用

匹配国内电话号码:\d{3}-\d{8}|\d{4}-\d{7}
评注:匹配形式如 0511-4405222 或 021-87888822

匹配腾讯QQ号:[1-9][0-9]{4,}
评注:腾讯QQ号从10000开始

匹配中国邮政编码:[1-9]\d{5}(?!\d)
评注:中国邮政编码为6位数字

匹配身份证:\d{15}|\d{18}
评注:中国的身份证为15位或18位

匹配ip地址:\d+\.\d+\.\d+\.\d+
评注:提取ip地址时有用

匹配特定数字:
^[1-9]\d*$    //匹配正整数
^-[1-9]\d*$   //匹配负整数
^-?[1-9]\d*$   //匹配整数
^[1-9]\d*|0$  //匹配非负整数(正整数 + 0)
^-[1-9]\d*|0$   //匹配非正整数(负整数 + 0)
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$   //匹配正浮点数
^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$  //匹配负浮点数
^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$  //匹配浮点数
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$   //匹配非负浮点数(正浮点数 + 0)
^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$  //匹配非正浮点数(负浮点数 + 0)
评注:处理大量数据时有用,具体应用时注意修正

匹配特定字符串:
^[A-Za-z]+$  //匹配由26个英文字母组成的字符串
^[A-Z]+$  //匹配由26个英文字母的大写组成的字符串
^[a-z]+$  //匹配由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$  //匹配由数字和26个英文字母组成的字符串
^\w+$  //匹配由数字、26个英文字母或者下划线组成的字符串
评注:最基本也是最常用的一些表达式

还有Flex的正则表达式工具RegExr air版在线版

【内容来源于网络】

posted on 2009-10-19 14:41  i'am sl  阅读(196)  评论(0)    收藏  举报