摘要: 问题 ​ 你想将HTML或者XML实体如&entity;或&#code;替换为对应的文本。再者,你需要转换文本特定的字符(比如<,>或者&)。 解决方案 ​ 如果你想替换文本字符串中的'<'或者'>',使用html.escape()函数可以很容易的完成。比如: s='The report said 阅读全文
posted @ 2022-03-04 12:10 qiupeng 阅读(42) 评论(0) 推荐(0)
摘要: 变量 ​ 你想创建一个内嵌变量的字符串,变量被它的值所表示的字符串替换掉。 解决方案 ​ Python并没有在字符串中简单替换变量值提供直接的支持,但是通过使用字符的format()方法来解决这个问题,比如: s='{name} has {n} message' print(s.format(nam 阅读全文
posted @ 2022-02-28 17:33 qiupeng 阅读(139) 评论(0) 推荐(0)
摘要: 问题 ​ 你想将几个小的字符串合并为一个大的字符串 解决方案 ​ 如果你想合并的字符串是一个序列或者iterable中,那么最快的方式就是使用join()方法,比如 parts=['Is','Chicago','Not','Chicago?'] print(' '.join(parts)) # -> 阅读全文
posted @ 2022-02-28 16:33 qiupeng 阅读(63) 评论(0) 推荐(0)
摘要: 问题 ​ 你想通过某种对齐方式来格式化字符串 解决方案 ​ 对于基本的字符串对齐操作,可以使用字符串ljust(),rjsut()和center()方法。比如: text='Hello World' print(text.ljust(20)) print(text.rjust(20)) print( 阅读全文
posted @ 2022-02-28 16:01 qiupeng 阅读(130) 评论(0) 推荐(0)
摘要: 问题 ​ 一些无聊的幼稚黑客在你的网站页面的表单中输入文本你'pÃthöñ',然后你想将这些字符清理掉。 解决方案 ​ 文本清理问题会涉及到包含文本解析与数据处理等一系列问题。在非常简单的情形下,你可能会选择使用字符串函数(比如str.upper()和str.lower())将文本转为标准格式。使用 阅读全文
posted @ 2022-02-28 15:04 qiupeng 阅读(58) 评论(0) 推荐(0)
摘要: 问题 ​ 你想去掉文本字符串开头,结尾或者中间不想要的字符,比如空白。 解决方案 ​ lstrip()方法能用于删除开始或者结尾的字符。lstrip()和 rstrip()分别从左或者右执行删除操作。默认情况下,这些方法会去掉空白字符,但是你也可以指定其他字符。 s=' hello world \n 阅读全文
posted @ 2022-02-28 13:59 qiupeng 阅读(97) 评论(0) 推荐(0)
摘要: ​ 问题 ​ 你正在使用正则表达式处理文本,但是关注的是Unicode字符处理。 解决方案 ​ 默认情况下re已经对一些Unicode字符类有了基本的支持,比如,\\d已经匹配任意的unicode数字字符了: import re num=re.compile('\d+') print(num.mat 阅读全文
posted @ 2022-02-28 11:57 qiupeng 阅读(115) 评论(0) 推荐(0)
摘要: 问题 ​ 你正在处理Unicode字符串,需要确保所有字符串在底层有相同的表示。 解决方案 ​ 在Unicode中,某些字符能够用多个合法的编码表示。为了说明,考虑下面的这个列子: s1='Spicy Jalape\u00f1o' s2='Spicy Jalapen\u0303o' print(s1 阅读全文
posted @ 2022-02-21 13:55 qiupeng 阅读(74) 评论(0) 推荐(0)
摘要: 问题 ​ 你正在试着用正则表达式去匹配一大块的文本,而你需要跨越多行去匹配。 解决方案 ​ 这个问题很典型的小淮娘在当你用点(.)去匹配任意字符的时候,忘记了点(.) 不能匹配换行符的事实。比如假设你想试着匹配C语言分割的注释: import re comment = re.compile(r'/\ 阅读全文
posted @ 2022-02-21 11:22 qiupeng 阅读(79) 评论(0) 推荐(0)
摘要: 问题 ​ 正则表达式匹配某个文件模式,但是它是找到的模式最长可能匹配。而你想修改它变成查找最短的可能匹配。 解决方案 ​ 这个问题一般出现在需要匹配一对分隔符之间的文本的时候(比如引号包含的字符串)。为了说明清楚,考虑如下的例子: import re str_pat = re.compile(r'\ 阅读全文
posted @ 2022-02-18 17:45 qiupeng 阅读(50) 评论(0) 推荐(0)