Python3错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 解决方法

import urllib.request

response = urllib.request.urlopen("https://www.51job.com")

print(response.read().decode('utf-8'))


报错
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 225: invalid continuation byte

改为
print(response.read().decode('gbk'))

程序就好了

 

 

翻到了一篇博客,里面有这么一段话:

如果python中所要处理的字符串中包含中文,那么最好要搞懂所用字符的编码,是gbk/gb2312/gb18030,还是utf-8,否则容易出现乱码,以及此处的语法错误。

尝试将编码方式改为“gbk”或者“gb2312”以及“gb18030”之后,输出就正常了,这说明原来的中文字符是采用gbk/gb2312/gb18030编码的。

posted @ 2022-03-15 17:46  nightmare梦魇  阅读(2517)  评论(0)    收藏  举报