Thinking in java(八)-正则表达式

正则表达式
1.
正则表达式符号介绍:正则表达式一般也需要使用字符串进行展示:
1、一般符号
x: 指的是普通字符,x代表的是未知数,代表着任何一个普通字符,举例x可以代表a,也可以代表b,同时也可以代表c等普通字符。
举例说明:”a[1-9][0-9]{4,11}”这里所写的a就是普通字符x中的一种,这时x就代表a,那么也就是说此正则表达式的第一位只能是普通字符a;

\ : 表示反斜线 例:“\” 在正则中就是“\”
\t :制表符。相当于tab键。

2、给出某个位置上可以出现的多个字符
[ ]表示范围的意思。表示某一位上可以出现的字符数据,如果正则中需要匹配的某个字符串中某一位上的字符是唯一的,这时可以省略中括号。
[abc] 表示要么是a要么是b还可以是c(只能是其中任意一个)
例:”NBA” 正则:”N[ABC]A” 匹配正确:NBA NAA NCA
[^abc] 当前要匹配的某个字符串中的某一位上不能是a 或b 或c(除了a,b,c都可以)
[a-z] 表示26个小写字母
[A-Z] 表示26个大写字母
[a-zA-Z] 表示26个大小写字母
[a-d[m-p]] 当前要匹配的某个字符串中的某一位上 可以是a -d 或 m - p 的字符
[a-d&&[d-f]] 表示只能是d。必须在两个范围中都要符合 。(交集)
[a-d&&[^d-f]] 表示只能是a,b,c
[a-z&&[^xyz]] 表示只能是除去x,y,z后的所有小写字母
[0-9] 表示0~9之间任意数字

3、提前定义好的一些符号,可以代替上述的[]书写的范围

. 点 表示当前需要匹配的字符串位置上可以是任意的字符。例:以a开始后面可以是任意字符 “a.” (如果想要的不是任意字符,而是“.”那么要转义,\.)
\d 表示数字。[0-9] 例:“A[\d]C” 表示A和C之间可以任意的0~9之间的数字。
说明:为什么在上述正则表达式“A[\d]C”中书写\d,而不是直接书写\d呢?
\d 代表着正则表达式中的一个符号,\和d放在一起代表0~9的十个数字。一旦将\d书写在””双引号中作为字符串,会出现一个问题,\就会把这个d转义了,一旦转义就不表示\d是一起的了,那怎么解决这种问题呢?
我们应该在\d前面在加一个,如:\d,第一个 \ 表示将第二个 \ 转义成普通的反斜线字符,而变成普通的反斜线之后和d组合就代表着正则中的数字,所以我们需要这样写:”\d” 等同于”[0-9]”

总结:以后只要在正则表达式中有\的,我们都写两个\。

\D 表示非数字。[^0-9]
\w 表示[a-zA-Z_0-9]。可以是任意数字、任意大小写字母、下划线。
\W 表示[^a-zA-Z_0-9]表示和\w相反。
4、边界匹配

^ 表示行的开头 例:“^h.” 表示只能是以h作为开头
h.o” 表示只能以h作为开头,以o作来结尾

5、数量词:表示当前正则表达式中某个规则可以出现的次数。 注意:数量词前面必须有存在正则符号。

“A?” 表示当前需要匹配字符串这个位置开始往后大写字母A可以出现零次或一次;
举例:”[0-9]?”表示在当前的字符串位置上0~9之间的任何一个数只能出现零次或者一次;

“A*” 表示当前需要匹配字符串这个位置开始往后大写字母A可以出现零次或多次;
举例:”[0-9]*”表示在当前的字符串位置上0~9之间的任何一个数可以出现零次或者一次或者多次;

“A+” 表示当前需要匹配字符串这个位置开始往后大写字母A可以出现一次或多次;
举例:”[0-9]+”表示在当前的字符串位置上0~9之间的任何一个数可以出现一次或者多次;

“A{n}”—-> “A{10}” 表示当前需要匹配字符串这个位置开始往后大写字母A必须出现10次;
举例:”[0-9]{10}”表示在当前的字符串位置上0~9之间的任何一个数可以出现10次;

“A{n,}—–>”“A{10,}”表示当前需要匹配字符串这个位置开始往后大写字母A最少出现10次;
举例:”[0-9]{10,}”表示在当前的字符串位置上0~9之间的任何一个数最少出现10次;

“A{n,m}”—->“A{10,20}”表示当前需要匹配字符串这个位置开始往后大写字母A最少出现10次,最多20次;
举例:”[0-9]{10,20}”表示在当前的字符串位置上0~9之间的任何一个数最少出现10次,最多20次;

正则的符号:
. 表示任意的字符
() 对已经存在的正则进行分组 同一正则引入组 \\编号 ,不同 $编号
[] 某个字符串位置上可以出现的字符列表
{}当前某个正则规则出现的次数
? 表示当前的规则可以出现零次或一次
* 表示当前的规则可以出现零次或一次或多次   
+ 表示当前的规则可以出现一次或多次

\d 数字字符 [0-9]
\w 数字 字母 下划线[0-9a-zA-Z_]
^    表示行的开头  例:“^h.” 表示只能是以h作为开头
$    表示行的结尾  例:”^h.o$” 表示只能以h作为开头,以o作来结尾

a)  [ ]表示范围;[abc]  表示要么是a要么是b还可以是c(只能是其中任意一个)
b)  \\ : 表示反斜线     例:“\\”     在正则中就是“\”
c)  [a-zA-Z] 表示26个大小写字母
d)  [0-9]      表示0~9之间任意数字

2.功能介绍
正则表达式的主要功能:
它主要是用来对字符串进行操作:匹配(验证)、切割、替换、获取。
匹配:
boolean matches(String regex)字符串是否匹配regex
切割:
string[] split(String regex)
string[] split(String regex,int limit)
String replaceAll(String regex,String replacement)使用给定的replacement替换此字符串所有匹配的给定的regex子字符串.
获取:
正则对象和匹配器的使用:
1、需要把一个正则表达式,通过Pattern类中的compile函数编译成正则对象;
2、使用Pattern类中matcher方法让正则对象和需要操作的字符串产生关系,得到一个匹配器对象;
使用匹配器中的find进行匹配,使用group方法获取到匹配到的字符串;
两个对象:
1、正则表达式对象
2、匹配器对象

“/**
*@desc 正则表达式对象pattern
*/
public class PatternDemo{
public static void main(String[] args){
String regex = “1[34578][0-9]{9}”;
//Pattern对象
Pattern pattern =- Pattern.compile(regex);
String s = “qwqe13555262366”;
//获取匹配器
Mathcer matcher =pattern.matcher(s);
while(matcher.find()){
System.out.println(matcher.group());
}
}
}
“`
正则对象和匹配器的使用:
1、需要把一个正则表达式,通过Pattern类中的compile函数编译成正则对象;
2、使用Pattern类中matcher方法让正则对象和需要操作的字符串产生关系,得到一个匹配器对象
3、使用匹配器中的find进行匹配,使用group方法获取到匹配到的字符串;

正则中的组:用()封装,顺序从1开始,如果要使用组 \组号
a) “([a-z_A-Z])bc\1”

基本包装类型:
这里写图片描述

posted @ 2018-03-12 21:44  XueXueLai  阅读(109)  评论(0编辑  收藏  举报