会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
qiupeng
博客园
首页
新随笔
联系
管理
订阅
上一页
1
2
3
4
5
6
下一页
2022年3月4日
2.17在字符串中处理html和xml
摘要: 问题 你想将HTML或者XML实体如&entity;或&#code;替换为对应的文本。再者,你需要转换文本特定的字符(比如<,>或者&)。 解决方案 如果你想替换文本字符串中的'<'或者'>',使用html.escape()函数可以很容易的完成。比如: s='The report said
阅读全文
posted @ 2022-03-04 12:10 qiupeng
阅读(42)
评论(0)
推荐(0)
2022年2月28日
2.15字符串中插入变量
摘要: 变量 你想创建一个内嵌变量的字符串,变量被它的值所表示的字符串替换掉。 解决方案 Python并没有在字符串中简单替换变量值提供直接的支持,但是通过使用字符的format()方法来解决这个问题,比如: s='{name} has {n} message' print(s.format(nam
阅读全文
posted @ 2022-02-28 17:33 qiupeng
阅读(139)
评论(0)
推荐(0)
2.14合并病拼接字符串
摘要: 问题 你想将几个小的字符串合并为一个大的字符串 解决方案 如果你想合并的字符串是一个序列或者iterable中,那么最快的方式就是使用join()方法,比如 parts=['Is','Chicago','Not','Chicago?'] print(' '.join(parts)) # ->
阅读全文
posted @ 2022-02-28 16:33 qiupeng
阅读(63)
评论(0)
推荐(0)
2.13字符串对齐
摘要: 问题 你想通过某种对齐方式来格式化字符串 解决方案 对于基本的字符串对齐操作,可以使用字符串ljust(),rjsut()和center()方法。比如: text='Hello World' print(text.ljust(20)) print(text.rjust(20)) print(
阅读全文
posted @ 2022-02-28 16:01 qiupeng
阅读(130)
评论(0)
推荐(0)
2.12 审查清理文本字符串
摘要: 问题 一些无聊的幼稚黑客在你的网站页面的表单中输入文本你'pÃthöñ',然后你想将这些字符清理掉。 解决方案 文本清理问题会涉及到包含文本解析与数据处理等一系列问题。在非常简单的情形下,你可能会选择使用字符串函数(比如str.upper()和str.lower())将文本转为标准格式。使用
阅读全文
posted @ 2022-02-28 15:04 qiupeng
阅读(58)
评论(0)
推荐(0)
2.11删除字符串中不需要的字符
摘要: 问题 你想去掉文本字符串开头,结尾或者中间不想要的字符,比如空白。 解决方案 lstrip()方法能用于删除开始或者结尾的字符。lstrip()和 rstrip()分别从左或者右执行删除操作。默认情况下,这些方法会去掉空白字符,但是你也可以指定其他字符。 s=' hello world \n
阅读全文
posted @ 2022-02-28 13:59 qiupeng
阅读(97)
评论(0)
推荐(0)
2.10 在正则中使用Unicode
摘要: 问题 你正在使用正则表达式处理文本,但是关注的是Unicode字符处理。 解决方案 默认情况下re已经对一些Unicode字符类有了基本的支持,比如,\\d已经匹配任意的unicode数字字符了: import re num=re.compile('\d+') print(num.mat
阅读全文
posted @ 2022-02-28 11:57 qiupeng
阅读(115)
评论(0)
推荐(0)
2022年2月21日
2.9Unicode 文本标准化
摘要: 问题 你正在处理Unicode字符串,需要确保所有字符串在底层有相同的表示。 解决方案 在Unicode中,某些字符能够用多个合法的编码表示。为了说明,考虑下面的这个列子: s1='Spicy Jalape\u00f1o' s2='Spicy Jalapen\u0303o' print(s1
阅读全文
posted @ 2022-02-21 13:55 qiupeng
阅读(74)
评论(0)
推荐(0)
2.8多行匹配
摘要: 问题 你正在试着用正则表达式去匹配一大块的文本,而你需要跨越多行去匹配。 解决方案 这个问题很典型的小淮娘在当你用点(.)去匹配任意字符的时候,忘记了点(.) 不能匹配换行符的事实。比如假设你想试着匹配C语言分割的注释: import re comment = re.compile(r'/\
阅读全文
posted @ 2022-02-21 11:22 qiupeng
阅读(79)
评论(0)
推荐(0)
2022年2月18日
2.7最短匹配模式
摘要: 问题 正则表达式匹配某个文件模式,但是它是找到的模式最长可能匹配。而你想修改它变成查找最短的可能匹配。 解决方案 这个问题一般出现在需要匹配一对分隔符之间的文本的时候(比如引号包含的字符串)。为了说明清楚,考虑如下的例子: import re str_pat = re.compile(r'\
阅读全文
posted @ 2022-02-18 17:45 qiupeng
阅读(50)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
下一页
公告