正则表达式

正则表达式

1、普通字符

—字母、数字、汉字、下划线、以及没有特殊定义的标定符号，都是"普通字符"。表达式中普通字符，自匹配一个字符串的时候，匹配与之相同的一个字符。

2、简单的转义字符

\n　　　　　　　　　　　　　　　　　　　　　代表换行符

\t　　　　　　　　　　　　　　　　　　　　　制表符

\\　　　　　　　　　　　　　　　　　　　　　代表\本身

\^ , \$ , $ , $ , \{ , \} , \? , \+ , \* , \| , \[ , \]　　　　匹配这些字符本身

3、标准字符集合

—能够与”多种字符“匹配的表达式

—注意区分大小写，大写是相反的意思。

\d　　　　　　　　　　　　　　　　任意一个数字，0-9中任意一个　　　

\w　　　　　　　　　　　　　　　　任意一个字母，一个数字，下划线

\s　　　　　　　　　　　　　　　　任意一个制表符、换行符、空格等空白字符

.　　　　　　　　　　　　　　　　　小数点可以匹配任意一个字符[除换行符]，

　　　　　　　　　　　　　　　　　如果要匹配包括”\n“在内的所有字符，一般用[\s\S]

4、自定义字符集合

—[ ]方括号匹配方式，能够匹配方括号中任意一个字符

[@ab5]　　　　　　　　　　　　匹配a,b,5,@

[^abc]　　　　　　　　　　　　匹配除a,b,c之外的任意一个字符

[f-k]　　　　　　　　　　　　　匹配f-k之间的任意一个字母

[^A-F0-3]　　　　　　　　　　匹配A-F 0-3之外的任意一个字符

— 正则表达式的特殊符号，被包含到中括号中，则是去特殊意义，除了^,-之外

—标准字符集合，除小数点外，如果被包含于中括号，自定义字符集合将包含该集合。

比如：[\d.\-+]将匹配：数字、小数点、+、-

5、量词

{n} 　　　　　　　　　　　　表示重复n次

{m,n}　　　　　　　　　　　表示至少重复m次，至多重复n次

{m,}　　　　　　　　　　　表示至少重复m次

？　　　　　　　　　　　　表示匹配表达式0次或1次，相当于{0,1}

+　　　　　　　　　　　表示匹配表达式至少出现1次，相当于{1,}

*　　　　　　　　　　　　表达式不出现或者出现任意次，相当于{0,}

匹配次数中的贪婪模式(匹配字符越多越好，默认！)
匹配次数中的非贪婪模式(匹配字符越少越好，修饰匹配次数的特殊符号再加上一个"？"号)

6、字符边界

——（本组标记匹配的不是字符而是位置，符合某种条件的位置）

　　^　　　　　　　　与字符串开始的地方匹配

　　$　　　　　　　　与字符串结束的地方匹配

　　\b　　　　　　　　匹配一个单词边界

——\b匹配这样一个位置：前面的字符和后面的字符不全是\w

　　　　　　IGNORECASE忽略大小写模式

　　　　　　　　-匹配时忽略大小写

　　　　　　　　-默认情况下，正则表达式是要区分大小写的。

　　　　　　SINGLELINE单行模式

　　　　　　　　-整个文本看作一个字符串，只有一个开头，一个结尾。

　　　　　　　　-是小数点"."可以匹配包含换行符(\n)在内的任意字符。

　　　　　　MULTLINE多行模式

　　　　　　　　-每行都是一个字符串，都有开头和结尾。

　　　　　　　　-在指定MULTLINE之后，如果需要仅匹配字符串开始和结束位置可以使用\A和\Z

7、选择符和分组

　　表达式　　　　　　　　　　作用

　　| 分支结构　　　　左右两边表达式之间"或"关系，匹配左边或右边　　　

　　() 捕获组　　　　　(1)在被修饰匹配次数的时候，括号中的表达式可以作为整体被修饰

　　　　　　　　　　　(2)取匹配结果的时候，括号中的表达式匹配的内容可以被单独得到

　　　　　　　　　　　(3)每一对括号会分配一个编号，使用()的捕获根据左括号的顺序从　　　　　　　　　　　

　　　　　　　　　　　1开始自动编号，捕获元素编号为零的第一个捕获是由整个正则表

　　　　　　　　　　　达式模式匹配的文本

　　(?:expression)　　一些表达式中，不得不使用( )，但又不需要保存( )中子表达式匹配的内容，

　　非捕获组　　　　　这时可以用非捕获组来抵消使用( )带来的副作用。

8、反向引用(\nnn)

　　　　-每一对( )括号会分配一个编号，使用( )的捕获根据左括号的顺序从1开始自动编号。

　　　　-通过反向引用，可以对分组已捕获的字符串进行引用。

9、预搜索(零宽断言)

　　　　-只进行子表达式的匹配，匹配内容不计入最终的匹配结果，是零宽度

　　　　-这个位置应该符合某个条件，判断当前位置的前后字符，是否符合指定的条件，

　　　　但不匹配前后的字符，是对位置的匹配。

　　　　-正则表达式匹配过程中，如果子表达式匹配到的是字符内容，而非位置，

　　　　并被保存到最终的匹配结果中，那么就认为这个子表达式是占有字符的，

　　　　如果子表达式匹配的仅仅是位置，或者匹配内容并不保存到最终的匹配结果中，

　　　　那么就认为这个子表达式是零宽度的，占有字符还是零宽度，

　　　　是针对匹配的内容是否保存到最终的匹配结果中而言的

　　　　(?=exp)　　　　　　断言自身出现的位置的后面能匹配表达式exp

　　　　(?<=exp)　　　　　断言自身出现的位置的前面能匹配表达式exp

　　　　(?!exp)　　　　　　断言此位置的后面不能匹配表达式exp

　　　　(?<!exp)　　　　　　断言此位置的前面不能匹配表达式exp

　　　　电话号码验证：

　　　　　　　　(0\d{2,3}-\d{7,9}) | (1[35789]\d{9})

　　　　电子邮箱验证：

　　　　　　　　[\w\-]+@[a-z0-9A-Z]+(\.[A-Za-z]{2,4}){1,2}

   public static void main(String[] args) {
        //表达式对象
        Pattern p = Pattern.compile("([a-z]+)(\\d+)");
        //创建Matcher对象
        Matcher m = p.matcher("asd213err235rwq");
        //尝试将整个字符串与该模式进行匹配
       /* boolean b = m.matches();*/
        //将子字符串与之匹配
        while(m.find()){
            System.out.println(m.group(0));
            System.out.println(m.group(1));//第一个括号里的
            System.out.println(m.group(2));//第二个括号里的
        }

　　　　　　//替换
     　　String str = m.replaceAll("#");
    　　 System.out.println(str);//##rwq
　　　　　　//分割

　　　　　　String str1 = "dwd23453sdfsafer";
　　　　　　String[] arr = str1.split("\\d+");
　　　　　　System.out.println(Arrays.toString(arr));
　　　　　　//[dwd, sdfsafer]

posted @ 2019-04-15 17:22 鸿森阅读(286) 评论(0) 收藏举报

刷新页面返回顶部

鸿森

正则表达式

公告