摘要:
问题:确保所有的Unicode字符串都拥有相同的底层 解决方案:为解决同一个文本拥有多种不同的表示形式问题,应该先将文本统一表示为规范形式,这可以通过unicodedata模块来完成, unicodedata.normalize(字符串规定采用的规范,字符串)。 在Unicode中,有些特定的字符可 阅读全文
posted @ 2016-08-20 20:38
垄上行
阅读(862)
评论(0)
推荐(0)
摘要:
问题:用正则表达式对一段文本块做匹配,但是希望在进行匹配时能够跨越多行 解决方案: 1、正则表达式添加对换行符的支持; 2、re.compile()函数一个有用的标记-re.DOTALL使得正则表达式中的句点(.)可以匹配所有的字符,也包括换行符; 如上问题一般出现在希望使用句点(.)来匹配任意字符 阅读全文
posted @ 2016-08-20 17:50
垄上行
阅读(248)
评论(0)
推荐(0)
摘要:
问题:使用正则表达式对文本模式匹配,将识别出来的最长的可能匹配修改为找出最短的可能匹配 解决方法:在匹配模式中的*操作符后加上?修饰符 (a)例子中被错误的匹配成2个被引号包围的字符串 补充:本节提到了一个当编写含有句点(.)字符的正则表达式时会遇到的问题。 在模式匹配中,句点除了换行符之外可匹配任 阅读全文
posted @ 2016-08-20 17:31
垄上行
阅读(245)
评论(0)
推荐(0)
摘要:
问题:以不区分大小写的方式对文本做查找和替换 解决方法:使用re模块,并对各种操作都添加上re.IGNORECASE标记 以上待替换的文本与匹配的文本大小写并不吻合,例如Python替换为snake,而非Snake。若要修正该问题,需使用一个支撑函数: 阅读全文
posted @ 2016-08-20 17:21
垄上行
阅读(472)
评论(0)
推荐(0)
摘要:
问题:对字符串中的文本做查找和替换 解决方案: 1、对于简单模式:str.replace(old, new[, max]) 2、复杂模式:使用re模块中的re.sub(匹配的模式, newstring, oldstring[,替换个数])函数 3、re.subn()可以获得替换的总次数 阅读全文
posted @ 2016-08-20 17:01
垄上行
阅读(305)
评论(0)
推荐(0)

浙公网安备 33010602011771号