随笔档案「2016年8月20日」：【python cookbook】【字符串与文本】9.将U... - 垄上行

2016年8月20日

【python cookbook】【字符串与文本】9.将Unicode文本统一表示为规范形式

摘要：问题：确保所有的Unicode字符串都拥有相同的底层解决方案：为解决同一个文本拥有多种不同的表示形式问题，应该先将文本统一表示为规范形式，这可以通过unicodedata模块来完成， unicodedata.normalize(字符串规定采用的规范,字符串)。在Unicode中，有些特定的字符可阅读全文

posted @ 2016-08-20 20:38 垄上行阅读(884) 评论(0) 推荐(0)

【python cookbook】【字符串与文本】8.编写多行模式的正则表达式

摘要：问题：用正则表达式对一段文本块做匹配，但是希望在进行匹配时能够跨越多行解决方案： 1、正则表达式添加对换行符的支持； 2、re.compile()函数一个有用的标记-re.DOTALL使得正则表达式中的句点（.）可以匹配所有的字符，也包括换行符；如上问题一般出现在希望使用句点（.）来匹配任意字符阅读全文

posted @ 2016-08-20 17:50 垄上行阅读(266) 评论(0) 推荐(0)

【python cookbook】【字符串与文本】7.定义实现最短匹配的正则表达式

摘要：问题：使用正则表达式对文本模式匹配，将识别出来的最长的可能匹配修改为找出最短的可能匹配解决方法：在匹配模式中的*操作符后加上？修饰符（a）例子中被错误的匹配成2个被引号包围的字符串补充：本节提到了一个当编写含有句点（.）字符的正则表达式时会遇到的问题。在模式匹配中，句点除了换行符之外可匹配任阅读全文

posted @ 2016-08-20 17:31 垄上行阅读(270) 评论(0) 推荐(0)

【python cookbook】【字符串与文本】6.以不区分大小写的方式对文本做查找和替换

摘要：问题：以不区分大小写的方式对文本做查找和替换解决方法：使用re模块，并对各种操作都添加上re.IGNORECASE标记以上待替换的文本与匹配的文本大小写并不吻合，例如Python替换为snake，而非Snake。若要修正该问题，需使用一个支撑函数：阅读全文

posted @ 2016-08-20 17:21 垄上行阅读(496) 评论(0) 推荐(0)

【python cookbook】【字符串与文本】5.查找和替换文本

摘要：问题：对字符串中的文本做查找和替换解决方案： 1、对于简单模式：str.replace(old, new[, max]) 2、复杂模式：使用re模块中的re.sub(匹配的模式, newstring, oldstring[，替换个数])函数 3、re.subn()可以获得替换的总次数阅读全文

posted @ 2016-08-20 17:01 垄上行阅读(332) 评论(0) 推荐(0)

垄上行

公告