chunchunboke

博客园 首页 新随笔 联系 订阅 管理

刚入门python!

记录一下网页返回源码,中文部分被unicode编码,python如何处理

  1.先提取编码后的数据(如果不提取正篇源码直接unicode解码,解码方法无法识别) 这个步骤属于逻辑问题,在网上根本没人告诉你,我以为方法会自动识别unicode进行转码  我太菜了

  2.再进行解密   print(str.encode().decode('unicode_escape'))

 

字节集数据转16进制字符串  hex()

字符串前面r开头的秒用 :

  应用场景:1.在打开文件的时候open(r'c:\....') 

       2.自定义正则表达式或者unicode字符集的时候

       

总结:'r'是防止字符转义的 如果路径中出现'\t'的话 不加r的话\t就会被转义 而加了'r'之后'\t'就能保留原有的样子

 

posted on 2022-12-04 14:03  小鹅通  阅读(160)  评论(0)    收藏  举报