快速上手系列:正则表达式

  1. 英文句点符号:匹配单个任意字符。eg:表达式t.o  可以匹配:tno,t#o,teo等等。不可以匹配:tnno,to,Tno,t正o  等等。
  1. 方括号:只有方括号里面指定的字符才参与匹配,也只能匹配单个字符。eg:表达式:t[abcd]n  只可以匹配:tan,tbn,tcn,tdn。不可以匹配:thn,tabn,tn等。
   3. | 符号。相当与“或”,可以匹配指定的字符,但是也只能选择其中一项进行匹配。eg:表达式:t(a|b|c|dd)n 只可以匹配:tan,tbn,tcn,tddn。不可以匹配taan,tn,tabcn
  1. 表示匹配次数的符号:{n,}表示至少N次。eg:表达式:[0—9]{ 3 }  \— [0-9]{ 2 }  \— [0-9]{ 3 } 的匹配格式为:999—99—999 。因为“—”符号在正则表达式中有特殊的含义,它表示一个范围,所以在前面加转义字符“\”。
  1. ^符号:表示否。^符号被称为“否”符号,如果用在方括号内,“^“表示不想匹配的字符。eg:表达式:[^x] 第一个字符不能是x
   6.圆括号,和空白符号。“\s”是空白符号,只可以匹配一个空格、制表符、回车符、换页符,不可以匹配自己输入的多个空格。()是分组号,可以用ORO API提取处出值,后面将详细讨论。
   7.正则表达式的一些快捷符号:
        \d表示[0—9],  \D表示[^0—9],  \w表示[0—9A—Z_a—z],\W表示[^0—9A—Z_a—z],  \s^_^表示[\t\n\r\f],   \S表示[^\t\n\r\f]
   8. 一些常用的正则表达式:
    Java:(([a-z]|_)(\\w*)){6,20}匹配以字母或下划线开头,字母数字下划线结尾的字符串
    JavaScript:/^(\-?)(\d+)$/匹配数字。/^\w+$/匹配字母数字下划线。
    .+ 一个或多个字符
    /0 第一次匹配的字符串
  1. java类中使用正则表达式:
    eg1:
    Pattern p = Pattern.compile("t.n");
     Matcher m = p.matcher(“ton”);
     if(m.matches()){
        return true;
     }
    eg2:boolean bool=Pattern.matches (“t.n”,”ton”);
    //如果一个正则表达式要重复利用,用第一种,如果只匹配一次,第二种是最佳选择。
  1. 反斜线字符(‘\’)用于转义字符,同时还可以引用非转义字符(不包括非转义字母)
  因此‘\\’表示‘\’,‘\{’表示{。  但是‘\y’就是错的,因为在不表示转义构造的 任何字母字符前 使用反斜线都是错误的。
  根据 Java Language Specification 的要求,Java 源代码的字符串中的反斜线被解释为 Unicode 转义或其他字符转义。因此必须在字符串字面值中使用两个反斜线,表示正则表达式受到保护,不被 Java 字节码编译器解释。例如,当解释为正则表达式时,字符串字面值 "\b" 与单个退格字符匹配,而 "\\b" 与单词边界匹配。字符串字面值 "\(hello\)" 是非法的,将导致编译时错误;要与字符串 (hello) 匹配,必须使用字符串字面值 "\\(hello\\)"。 注意:‘\b’是一个字符而‘\\b’是两个字符
  1. Pattern类

      11.1  8种模式:比如启用多行模式,启用unix模式等。eg1: int CASE_INSENSITIVE表示启用不区分大小写的模式。

      11.2  4个静态方法

两个单例模式构造器:
Pattern compile(String regex);
Pattern compile(String regex,int flags)flags为八种模式的一种
eg2:
Pattern p=Pattern.compile("[a-z]\\s[a-z]");
    Matcher m=p.matcher("b   c");
    if(m.matches())  
          Sysout(1111);
    else  
          Sysout(2222);  //输出结果为1111;
一个匹配方法,一个返回String的字面值模式方法:
boolean matches(String regex,CharSequence input);//input与regex匹配返回true。
String quote(String s);//返回指定String的字面值。
eg3:
boolean bool=Pattern.matches("[a-z] [a-z]",”b c”); //结果为true
Sysout(Pattern.quote(“a_#/tb”)); //输出结果为 “\Qa_# b”\E

      11.3  6个普通方法

返回此模式的匹配器: Matcher  matcher(CharSequence input);
返回此模式的标志:   int flags();
返回此模式的regex:  String pattern();
两个字符串切割方法: 
        String[] split(CharSequence input); String[] split(CharSequence input,
int limit); limit为返回字符串的个数,如果等于0,返回所有 拆分的字符串,如果大于拆分字符串的实际个数,返回实际个数。        toString方法:String toString(); eg4: Pattern p=Pattern.compile("[,;\\s]"); String str="wo,ai;ni haha"; String[] strs=p.split(str); for(String s : strs){ Sysout(s);//输出 “wo” “ai” “ni” “haha” } strs=p.split(str,2) for(String s : strs){ Sysout(s);//输出 “wo” “ai;ni haha” } Strs=p.split(str,0) for(String s : strs){ Sysout(s);//输出 “wo” “ai” “ni” “haha” }
 
 
附录:
js中常用的正则:
var reg = /^\d{11}$/; 
/^  开始
$/  结束
\d  表示匹配数字
{}  大括号里面写有几位数字,里面加逗号表示或者关系
写完要用正则去测对象,如reg.test(被测的对象名),返回boolean类。
下面以邮箱校验举例:
var reg = /^\w+@\w+.\w{2,3}(.\w{2,3})?$/;  加号表示出现一次或多次,不是连字符!小括号里的内容是选择出现,后面要加问号!
身份证:var reg = /^\d{15}$|^\d{18}$|^\d{17}(X|x)$/;  |表示或者
手机号:var reg = /^(182|135)\d{8}$/;
电话区号:var reg = /^\d{3}-\d{7,8}$/;

 

posted @ 2020-06-03 15:32  zhaot1993  阅读(400)  评论(0编辑  收藏  举报