关于JAVA正则匹配空白字符的问题(全角空格与半角空格)

今天遇到一个字符串,怎么匹配空格都不成功!!!

我把空格复制到test.properties文件 显示“\u3000” ,这是什么? 这是全角空格!!!

查了一下    \s    不支持全角

1、"\s"匹配的是哪一种空格?

正则表达式中\s匹配任何空白字符,包括空格、制表符、换页符等等;中文全角空格

\s 并不能匹配中文全角空格。

\s 只能匹配下面六种字符(详见 java.util.regex.Pattern 的 API DOC):

  1.   半角空格( )
  2.   水平制表符(\t)
  3.   竖直制表符
  4.   回车(\r)
  5.   换行(\n)
  6.   换页符(\f)

 java代码中的转义   \\s

正则匹配0个或多个空格,我是这样写的  \\s*

正则匹配一个或多个空格,我是这样写的  \\s+

 

2、如何匹配全角空格

正则可以这么写:"[\\s\\p{Zs}]+" , 注意java代码中的转义。

 

3、测试

我的测试例子:

package com.test;

public class zhengze {
	/**
	 * 替换多个<br>成单个<br>
	 * @param args
	 */
	public static void main(String[] args) {
		String str1= "...中间省略很多...<br>      <br>想到自己煮花生仁汤这么简单~赶紧动手试试吧!<br><br>      <br>    <br> <br>";
		String pattern = "<br>(\\s*<br>)+";
		System.out.println("\\s* 替换的结果:");
		System.out.println(str1.replaceAll(pattern,"<br>"));
		   
		
		String str2= "...中间省略很多...<br>      <br>想到自己煮花生仁汤这么简单~赶紧动手试试吧!<br><br>      <br>    <br> <br>";
		String new_pattern = "<br>([\\s\\p{Zs}]*<br>)+";
		System.out.println("[\\s\\p{Zs}]* 替换的结果:");
		System.out.println(str2.replaceAll(new_pattern,"<br>"));
		
	}
}

结果:

\s* 替换的结果:
...中间省略很多...<br>      <br>想到自己煮花生仁汤这么简单~赶紧动手试试吧!<br>      <br>    <br>
[\s\p{Zs}]* 替换的结果:
...中间省略很多...<br>想到自己煮花生仁汤这么简单~赶紧动手试试吧!<br>

  

posted @ 2017-07-10 19:10  Json_wangqiang  阅读(5437)  评论(0编辑  收藏  举报