Thinking in java(八)-正则表达式

正则表达式
1.
正则表达式符号介绍：正则表达式一般也需要使用字符串进行展示：
1、一般符号
x: 指的是普通字符，x代表的是未知数，代表着任何一个普通字符，举例x可以代表a,也可以代表b，同时也可以代表c等普通字符。
举例说明：”a[1-9][0-9]{4,11}”这里所写的a就是普通字符x中的一种，这时x就代表a,那么也就是说此正则表达式的第一位只能是普通字符a;

\ : 表示反斜线例：“\” 在正则中就是“\”
\t :制表符。相当于tab键。

2、给出某个位置上可以出现的多个字符
[ ]表示范围的意思。表示某一位上可以出现的字符数据，如果正则中需要匹配的某个字符串中某一位上的字符是唯一的，这时可以省略中括号。
[abc] 表示要么是a要么是b还可以是c(只能是其中任意一个)
例：”NBA” 正则：”N[ABC]A” 匹配正确：NBA NAA NCA
[^abc] 当前要匹配的某个字符串中的某一位上不能是a 或b 或c（除了a,b,c都可以）
[a-z] 表示26个小写字母
[A-Z] 表示26个大写字母
[a-zA-Z] 表示26个大小写字母
[a-d[m-p]] 当前要匹配的某个字符串中的某一位上可以是a -d 或 m - p 的字符
[a-d&&[d-f]] 表示只能是d。必须在两个范围中都要符合。(交集)
[a-d&&[^d-f]] 表示只能是a,b,c
[a-z&&[^xyz]] 表示只能是除去x,y,z后的所有小写字母
[0-9] 表示0~9之间任意数字

3、提前定义好的一些符号，可以代替上述的[]书写的范围

. 点表示当前需要匹配的字符串位置上可以是任意的字符。例：以a开始后面可以是任意字符 “a.” (如果想要的不是任意字符，而是“.”那么要转义，\.)
\d 表示数字。[0-9] 例：“A[\d]C” 表示A和C之间可以任意的0~9之间的数字。
说明：为什么在上述正则表达式“A[\d]C”中书写\d，而不是直接书写\d呢?
\d 代表着正则表达式中的一个符号，\和d放在一起代表0~9的十个数字。一旦将\d书写在””双引号中作为字符串，会出现一个问题，\就会把这个d转义了，一旦转义就不表示\d是一起的了，那怎么解决这种问题呢？
我们应该在\d前面在加一个,如：\d,第一个 \ 表示将第二个 \ 转义成普通的反斜线字符，而变成普通的反斜线之后和d组合就代表着正则中的数字，所以我们需要这样写：”\d” 等同于”[0-9]”

总结：以后只要在正则表达式中有\的，我们都写两个\。

\D 表示非数字。[^0-9]
\w 表示[a-zA-Z_0-9]。可以是任意数字、任意大小写字母、下划线。
\W 表示[^a-zA-Z_0-9]表示和\w相反。
4、边界匹配

^ 表示行的开头例：“^h.” 表示只能是以h作为开头
$表示行的结尾例： ”^{h} . o$ ” 表示只能以h作为开头，以o作来结尾

5、数量词：表示当前正则表达式中某个规则可以出现的次数。注意：数量词前面必须有存在正则符号。

“A?” 表示当前需要匹配字符串这个位置开始往后大写字母A可以出现零次或一次；
举例：”[0-9]?”表示在当前的字符串位置上0~9之间的任何一个数只能出现零次或者一次；

“A*” 表示当前需要匹配字符串这个位置开始往后大写字母A可以出现零次或多次；
举例：”[0-9]*”表示在当前的字符串位置上0~9之间的任何一个数可以出现零次或者一次或者多次；

“A+” 表示当前需要匹配字符串这个位置开始往后大写字母A可以出现一次或多次；
举例：”[0-9]+”表示在当前的字符串位置上0~9之间的任何一个数可以出现一次或者多次；

“A{n}”—-> “A{10}” 表示当前需要匹配字符串这个位置开始往后大写字母A必须出现10次；
举例：”[0-9]{10}”表示在当前的字符串位置上0~9之间的任何一个数可以出现10次；

“A{n,}—–>”“A{10,}”表示当前需要匹配字符串这个位置开始往后大写字母A最少出现10次；
举例：”[0-9]{10,}”表示在当前的字符串位置上0~9之间的任何一个数最少出现10次；

“A{n,m}”—->“A{10,20}”表示当前需要匹配字符串这个位置开始往后大写字母A最少出现10次，最多20次；
举例：”[0-9]{10,20}”表示在当前的字符串位置上0~9之间的任何一个数最少出现10次，最多20次；

正则的符号：
. 表示任意的字符
() 对已经存在的正则进行分组 同一正则引入组 \\编号 ，不同 $编号
[] 某个字符串位置上可以出现的字符列表
{}当前某个正则规则出现的次数
? 表示当前的规则可以出现零次或一次
* 表示当前的规则可以出现零次或一次或多次   
+ 表示当前的规则可以出现一次或多次

\d 数字字符 [0-9]
\w 数字 字母 下划线[0-9a-zA-Z_]
^    表示行的开头  例：“^h.” 表示只能是以h作为开头
$    表示行的结尾  例：”^h.o$” 表示只能以h作为开头，以o作来结尾

a)  [ ]表示范围；[abc]  表示要么是a要么是b还可以是c(只能是其中任意一个)
b)  \\ : 表示反斜线     例：“\\”     在正则中就是“\”
c)  [a-zA-Z] 表示26个大小写字母
d)  [0-9]      表示0~9之间任意数字

2.功能介绍
正则表达式的主要功能：
它主要是用来对字符串进行操作：匹配（验证）、切割、替换、获取。
匹配:
boolean matches(String regex)字符串是否匹配regex
切割:
string[] split(String regex)
string[] split(String regex,int limit)
String replaceAll(String regex,String replacement)使用给定的replacement替换此字符串所有匹配的给定的regex子字符串.
获取：
正则对象和匹配器的使用：
1、需要把一个正则表达式，通过Pattern类中的compile函数编译成正则对象；
2、使用Pattern类中matcher方法让正则对象和需要操作的字符串产生关系，得到一个匹配器对象；
使用匹配器中的find进行匹配，使用group方法获取到匹配到的字符串；
两个对象:
1、正则表达式对象
2、匹配器对象

“/**
*@desc 正则表达式对象pattern
*/
public class PatternDemo{
public static void main(String[] args){
String regex = “1[34578][0-9]{9}”;
//Pattern对象
Pattern pattern =- Pattern.compile(regex);
String s = “qwqe13555262366”;
//获取匹配器
Mathcer matcher =pattern.matcher(s);
while(matcher.find()){
System.out.println(matcher.group());
}
}
}
“`
正则对象和匹配器的使用：
1、需要把一个正则表达式，通过Pattern类中的compile函数编译成正则对象；
2、使用Pattern类中matcher方法让正则对象和需要操作的字符串产生关系，得到一个匹配器对象；
3、使用匹配器中的find进行匹配，使用group方法获取到匹配到的字符串；

正则中的组：用()封装，顺序从1开始，如果要使用组 \组号
a) “([a-z_A-Z])bc\1”

基本包装类型:
这里写图片描述

posted @ 2018-03-12 21:44 XueXueLai 阅读(115) 评论(0) 收藏举报

刷新页面返回顶部

CoderRyze

20200322，使用博客园的一键导入功能，从csnd导入了部分博客，但是很多csdn中的转载文章的标志与原文url连接都没有导入过来，文章仅作学习使用，侵权立删。

Thinking in java(八)-正则表达式

公告