摘要:
python支持很多通配符和转义字符作为正则的合法字符,记录少许 . 匹配任意单个字符 * 匹配前面的表达式或则字符 0次或者多次 + 匹配前面的表达式或者字符 至少一次 ? 匹配前面的表达式或则字符 0次或者1次 [A-Z] 任选一个 () 编组 {n} 重复n次 {n,} 重复n到多次 {n,m 阅读全文
posted @ 2022-05-07 23:07
不要西红柿
阅读(43)
评论(0)
推荐(0)
摘要:
from urllib.request import urlopen url = "http://www.baidu.com" resp = urlopen(url) # encode 编码 decode 解码 with open("mybaidu.html", "w", encoding="utf 阅读全文
posted @ 2022-05-07 22:58
不要西红柿
阅读(180)
评论(0)
推荐(0)
摘要:
今天在写入文件时候遇到了中文乱码的问题。 问题描述: 字符串转以utf-8编码的字符数组 bytes,然后使用 bytes.decode("utf-8")写入文件中。html指定为utf-8编码,结果页面出现中文乱码。 出现问题的原因是因为生成的html文件是以gbk编码存储的,代码如下: # 在 阅读全文
posted @ 2022-05-04 00:15
不要西红柿
阅读(2318)
评论(0)
推荐(0)
浙公网安备 33010602011771号