刚入门python!
记录一下网页返回源码,中文部分被unicode编码,python如何处理
1.先提取编码后的数据(如果不提取正篇源码直接unicode解码,解码方法无法识别) 这个步骤属于逻辑问题,在网上根本没人告诉你,我以为方法会自动识别unicode进行转码 我太菜了
2.再进行解密 print(str.encode().decode('unicode_escape'))
字节集数据转16进制字符串 hex()
字符串前面r开头的秒用 :
应用场景:1.在打开文件的时候open(r'c:\....')
2.自定义正则表达式或者unicode字符集的时候
总结:'r'是防止字符转义的 如果路径中出现'\t'的话 不加r的话\t就会被转义 而加了'r'之后'\t'就能保留原有的样子
浙公网安备 33010602011771号