Python读取文件时出现UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position xx: 解决方案

主要原因是因为编码的问题,可能是因为0x80这个字节在gbk编码中没有这个字符,可能原字符是两个字节,在gbk里被解析成了一个字节,导致字符不存在。解决方法有两个,一个是二进制读取,一个是改编编码方式:

with open('article.txt','r',encoding='UTF-8') as f: # 打开新的文本
text_new = f.read() # 读取文本数据

posted @ 2022-02-01 20:20  GYYer  阅读(1740)  评论(0)    收藏  举报