博客园  :: 首页  :: 管理

关于. 点的说明:

通配符:与除 \n 之外的任何单个字符匹配。若要匹配文本句点字符(. 或 \u002E),你必须在该字符前面加上转义符 (\.)。

*  匹配上一个元素零次或多次。

image

笔者在使用的过程中,将整理的一些注意点记录如下

1、使用 .* 是可以一直匹配到\r回车符的(如果有的情况),所以如果是以\n为每行最后一符号的话,是匹配不到的,所以也就不能跨行了

2、如果使用 .*\n 就可以将一行的最后一个换行符匹配出来(如果有的情况),可以通过匹配的结果字符个数,看出效果,因为.*不能匹配到\n,所以结果也只能有一个\n换行符

3、对于从PDF中提取出多行文本、可以自己试着从中间的  xxx.* 匹配, 如果匹配的内容没有到最后一行的的结果 ,就基本可以说明每行是有 \n 符号的

4、对于匹配出来的结果包含了\r\n,都是可以通过 【裁剪文本】中的 ,要裁剪的内容:开头和末尾的空格字符 , 裁剪掉!

image

 

 

 

尊重别人的劳动成果 转载请务必注明出处:https://www.cnblogs.com/5201351/p/19064809