网页返回unicode源码 python解码详细步骤

刚入门python！

记录一下网页返回源码，中文部分被unicode编码，python如何处理

　　1.先提取编码后的数据（如果不提取正篇源码直接unicode解码，解码方法无法识别）这个步骤属于逻辑问题，在网上根本没人告诉你，我以为方法会自动识别unicode进行转码我太菜了

　　2.再进行解密 print(str.encode().decode('unicode_escape'))

字节集数据转16进制字符串 hex()

字符串前面r开头的秒用：

　　应用场景：1.在打开文件的时候open(r'c:\....')

　　　　　　　2.自定义正则表达式或者unicode字符集的时候

总结：'r'是防止字符转义的如果路径中出现'\t'的话不加r的话\t就会被转义而加了'r'之后'\t'就能保留原有的样子

posted on 2022-12-04 14:03 小鹅通阅读(162) 评论(0) 收藏举报

刷新页面返回顶部

chunchunboke