python爬取网页时出现 unicode encode error:'utf-8' codec can't encode character

检查一下爬虫编码时设置的header 的Accept-Encoding 是否为gzip, deflate, br

简单解决可以把这个属性去掉

另外一种解决方式就是对其解码，先获取网页的响应头，通过Content-Encoding来判断是gzip还是br

br需要导入brotli包（需要下载）调用brotli.decompress（data）解码。

gzip需要导入gzip包，调用gzip.decompress（data）解码。

posted @ 2021-05-07 14:49 低谷还能再向下阅读(427) 评论(0) 收藏举报

刷新页面返回顶部