java匹配中文的正则表达式

 

[\u4E00-\u9FA5]*

 

public static void regxChinese(){  
       // 要匹配的字符串     
       String source = "<span title='5 星级酒店' class='dx dx5'>";  
       // 将上面要匹配的字符串转换成小写     
      // source = source.toLowerCase();     
       // 匹配的字符串的正则表达式     
       String reg_charset = "<span[^>]*?title=\'([0-9]*[\\s|\\S]*[\u4E00-\u9FA5]*)\'[\\s|\\S]*class=\'[a-z]*[\\s|\\S]*[a-z]*[0-9]*\'";       

       Pattern p = Pattern.compile(reg_charset);     
       Matcher m = p.matcher(source);     
       while (m.find()) {     
        System.out.println(m.group(1));  
       }  
} 
 public static void regxChinese(){
        // 要匹配的字符串  
        String source = "<span title='5 星级酒店' class='dx dx5'>";
        // 将上面要匹配的字符串转换成小写  
       // source = source.toLowerCase();  
        // 匹配的字符串的正则表达式  
        String reg_charset = "<span[^>]*?title=\'([0-9]*[\\s|\\S]*[\u4E00-\u9FA5]*)\'[\\s|\\S]*class=\'[a-z]*[\\s|\\S]*[a-z]*[0-9]*\'";    

        Pattern p = Pattern.compile(reg_charset);  
        Matcher m = p.matcher(source);  
        while (m.find()) {  
         System.out.println(m.group(1));
        }
 }
posted @ 2014-08-03 17:52  ImWiki  阅读(10169)  评论(0编辑  收藏  举报