一. 什么是正则表达式

    从概念上来说,正则表达式也是一门小巧精炼的语言,他可以用来简化检索特点的字符串,替换特定的字符等功能,有许多开发语言工具,都内嵌支持正则表达式,那么一个正则表达式,  他就是一个字符串,但这个字符串具有特定含义;

 

二.正则表达式的基础语法

1.字面值

  所谓字面值,就是没有任何转义,查找的对象就是其本身,比如正则表达式 abc,查找的就过就是返回要查找字符串中 abc三个字符连在一起的字符串, 又或者 123 就是查找123这个字符串.

 

2.特殊字符 (元字符)

(1)  句号

  " . " 在正则表达式中表示匹配任意字符,很相似于通配符  *  ,如果我们查找a.b 这个正则表达式, 我们可以找到所有开头为a,结尾为b 中间是任意字符的字符串, 比如abc,adc,a1c等等;

(2) 字符类 ( []w

  如果你在一个正则表达式中看到有一些字符被 [] 括起来,那么他们的含义将不再是简单的字面值,天猫表示某一个被括号中属性约束的字符.比如[123456],这个正则表达式表示找到1-6中任意的一个字符,又比如a[bd]c,这表示查找abc或者adc;

  注意:

    1,在字符类中字符的顺序和重复性都不是我们关心得. [123]和[2233111],含义是一模一样的

    2,句号在字符类中表示的就是其本身,[.]就是查找一个句号.

(3) 区间符号 ( - )

  如果我们需要查找一个数字,[0123456789],这样做是可以达到目的的,但这写起非常麻烦,并不符合正则表达式小巧的特性,这时我们可以使用区间符号来简化,[0-9]和上面的式子意义完全一样.同样,我们可以[a-zA-Z],表示任意一个字母.

注意:

  1,区间的范围应该有意义,[a-1]这样的区间并无任何意义,尽管它在语法上科恩个没有错误.

  2,区间左右两端对应的是字符,并不是数字,比如[2-41],这个式子的含义是找到2-4的一个数字或者1,和[1-4]是一样的.

 

(4) 取反符号(^)

   "^" 在正则表达式中取反,这个很好理解,[^a], 表示找到除了a之外的任意字符.[^0-9],表示找到一个非数字的字符.

  注意:

    1,^必须在中括号内,即字符类属性中使用.

    2,^是将后面的整体作为取反条件的.

 

(5) 简化的字符类

  某些符号具有和字符类相同的含义;

  \d 等同于 [0-9];

  \w 等同于 [0-9A-Za-z_] 表示数字字母以及下划线

  \s 等同于 tab换行等不可见字符

  与此相对的 \D,\W,\S, 则表示上述条件的取反情况;

(6) 乘法集 ( {} )

  乘法集的最大用处也是简化正则表达式,用大括号表示,比如 a{2} ,表示找打aa这个字符串;

  注意:乘法集是以前面整体为乘法条件的, 比如[ab]{2},不是简单的比配aa,bb,而是和[ab][ab]含义相同的,会匹配ab,ba,aa,bb;

(7) 乘法集中的区间 ( , )

  乘法集和字符串相同,也可以用区间进行简化,但是符号不相同. a{1,3},表示找打a,aa,aaa这三个字符串,a{0,1} 是合法的,表示找到空字符,或者a.  

  注:

    1,乘法集的"越长越好"属性:乘法集具有这样的特点,比如a{2,4},如果我搜索myaaaa,它不会找到aa后就停止,而是会找到aaaa.

    2,乘法集的"全部获取属性":比如a{2,4} 如果搜索myaayouaaaa,他会找到aa和aaaa.

    3,乘法集支持开区间,a{1,}是合法的,表示找到任何a相连的字符串.

(8) 判断符号 ( )

  这个符号的含义和 {0,1} 完全相同,123?4,表示匹配1234或者是124;

(9) 通配符号 ( * )

  这个符号的含义和{0,}相同,比如.*  表示通配一切字符串.

(10) +符号

   这个符号和{1,}相同

(11) 或符号 ( | )

  这个符号表示或的关系,比如abc|edf,表示找到abc获取edf;

(12) 组合 ( () )

  小括号在正则表达式中表示组合,比如(a|b|c)d,表示找到ad,bd,cd,可以将小括号的作用理解为优先级;

(13) 单词边界 ( \b )

  \b表示单词的边界,比如\b[a-z]{3}\b,,表示匹配一个三个字母的小写单词.

(14) 行边界 ( ^$ )

  单单的一个^符号表示行的开头,$表示行的结束.

  注意[^]是非法的,[$]表示匹配一个$符号

(15)查找元字符

  在正则表达式中还有一个转义字符"\",如果我们要查找., 只要查找\. 同理\[\] 就是查找'[]'这个字符串.如果要查找"\" 只要再加一个转义字符就好了 "\\";

posted on 2016-06-14 16:36  Yevgeni  阅读(127)  评论(0编辑  收藏  举报