Java 正则表达式

正则表达式,又称规则表达式。(英文名Regular Expression,所以代码中常以regex、regexp、RE表示)。

正则表达式简单说就是用于操作文本数据的规则表达式,在Java中我们使用正则表达式来对字符串进行“有规则的操作”,没理解没关系,看下面的练习就懂了。

正则表达式对字符串的常见操作:字符串的匹配切割替换获取

正则表达式语法(匹配规则

 

字符串的匹配:matches()

用法:

/*常用写法*/
1. boolean b = Pattern.matches("正则表达式", "匹配内容");

/*标准写法*/
2.Pattern p = Pattern.compile("正则表达式");  Matcher m = p.matcher("匹配内容");  
   boolean b = m.matches();

/*语句匹配写法*/
3.if(/^a*b$/.text("aaab")) {};

举例练习:

1.判断输入的字符串是否为合法手机号码。

public class regexTest {
    public static void main(String[] args) {
        String p1 = "15845678908";
        String p2 = "173438576288";
        boolean b1 = isphone_num(p1);
        boolean b2 = isphone_num(p2);
        System.out.println(p1+"是电话号码吗?"+b1);
        System.out.println(p2+"是电话号码吗?"+b2); 
    }    
    //匹配方法(以1开头第二位必须是3/5/7/8的11位纯数字组成)
    public static boolean isphone_num(String num) {
        //定义匹配规则:
        String regex = "1[3578][0-9]{9}";
        
        //判断是否符合规则
        boolean b = num.matches(regex);
        return b;
    }
}

结果:

2.判断邮箱是否为正确格式。

public class regexTest {
    public static void main(String[] args) {
        String p1 = "abc123@qq.com";
        String p2 = "ghtr343com";
        String p3 = "hkp123@163.com";
        boolean b1 = isemail(p1);
        boolean b2 = isemail(p2);
        boolean b3 = isemail(p3);
        System.out.println(p1+"是否为邮箱格式?"+b1);
        System.out.println(p2+"是否为邮箱格式?"+b2); 
        System.out.println(p3+"是否为邮箱格式?"+b3); 
    }    
    //匹配方法(以几个字母或数字开头 + @ +字母数字+.+字母)
    public static boolean isemail(String email) {
        //定义匹配规则:
        String regex = "[a-z0-9]+@[a-zA-Z0-9]+\\.[a-zA-Z]+";
        
        //判断是否符合规则
        boolean b = email.matches(regex);
        return b;
    }
}

结果:

3.判断身份证号码是否为正确格式

xxxxxx    yy MM dd    25 0     15位(第一代身份证,2004年之前)

xxxxxx yyyy MM dd 725 0     18位(第二代身份证)

地区: [1-9]\d{5}

年的前两位: (18|19|([23]\d))            1800-2399

年的后两位: \d{2}

月份: ((0[1-9])|(10|11|12)) 

天数: (([0-2][1-9])|10|20|30|31)          闰年不能禁止29+

三位顺序码: \d{3}

两位顺序码: \d{2}

校验码: [0-9Xx]

//身份证正则表达式(15位)
isIDCard1="^[1-9]\d{7}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{3}$ "

//身份证正则表达式(18位)
isIDCard2="^[1-9]\d{5}[1-9]\d{3}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{4}$ "

字符串切割:split()

对字符串进行切割就是对一个字符串按照某个或某些字符进行切割,从而变成若干字符串,切割的实质其实就是先进行字符串匹配,将匹配到的字符串“丢弃”,并将丢掉的前面部分和剩下的部分变成字符串数组。

用法:

String str = "需要切割的字符串";
//描述切割规则
String regex = "正则表达式";

//切割后的字符串仍是字符串:
String sstr1 = str.split(regex);

//切割后的字符串放在数组中:
String[] sstr2 = str.split(regex);

举例练习:

对字符串“哈哈##呵呵###哦哦#”进行切割,去掉#符号。

public class splitTest {
    public static void main(String[] args) {
        
        String s = "哈哈##呵呵###哦哦#";
        
        //描述切割规则:以若干#来切割
        String regex = "#+";
        
        //切割后的字符串数组:
        String[] sstr1 = s.split(regex);
        for(String string:sstr1){
            System.out.print(string);
        }
        
    }
}

结果: 

拓展:叠词切割 String regex = "(.)\\1+",这里用到了组的概念。

 

字符串替换:replaceAll()

利用正则表达式进行字符串替换其实是先匹配指定字符串中的字符,然后再用自定义字符替换掉匹配到的字符串。 

用法:

String str = "需要替换的字符串";      
//匹配规则
String regex = "正则表达式";
String Str = str.replaceAll(regex, "替换内容");

举例练习:

对字符串“哈喽##你好###大聪明”进行字符替换,把"#"替换成"、"。

public class replaceAllTest {
    public static void main(String[] args) {
        
        String str = "哈喽##你好###大聪明";
        
        //匹配规则
        String regex = "(.)\\1+";
        
        //替换为:
        String newStr = str.replaceAll(regex, "、");
        
        //替换后结果:
        System.out.println(newStr);
    }
    
}

 结果:

拓展:替代叠词 regex = "(.)\\1+";  String str2 = str1.replaceAll(regex, "$1");//多个重复只留一个

 

字符串获取:group()

正则表达式其实是封装成了Pattern类,所以字符串的匹配、切割、替换都是调用了Pattern类中的方法。所以如果我们需要获取指定字符串中的子串,首先同样的我们需要进行字符串匹配,然后判断指定字符串中是否有匹配的子串,有就获取,没有就获取不到。

获取子串的步骤:

  1、描述要获取的子串:匹配子串

  2、使用正则表达式的封装类Pattern来获取匹配器

  3、使用匹配器中的方法group()获取字符串的匹配的子串

举例练习:

1、获取字符串“Hi ! welcome to my blog haha”中为两个字母的单词.

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class groupTest {
    public static void main(String[] args) {
        String s = "Hi ! welcome to my blog haha";
        
        //1、匹配子串
        String regex = "\\b[a-zA-Z]{2}\\b";
        
        //2、获取匹配器
        Pattern p = Pattern.compile(regex);
        Matcher m = p.matcher(s);
        
        //3、使用匹配器的group()方法来获取:(find方法是判断是否具有匹配子串)、
        System.out.println("”"+s+"“中的两个字母的单词有:");
        while(m.find()){
            System.out.println(m.group());
        }
    }

 结果:

 

匹配规则

 

 

 

 


 

图片来源:https://www.cnblogs.com/fzz9/p/7744554.html

 

posted @ 2019-08-08 15:14  墨染尘  阅读(8353)  评论(0编辑  收藏  举报
Paris