解决“UnicodeEncodeError: 'gbk' codec can't encode character u'\xa9' in position 24051: illegal multibyte sequence”错误

今天我在爬取一个网页时出现了下面这个错误:

UnicodeEncodeError: 'gbk' codec can't encode character u'\xa9' in position 24051: illegal multibyte sequence

从这个错误来看应该是编码时出错了,于是我在网上查了些资料,找到了解决方法:

source_code.encode('GB18030')

解释:GB18030是GBK的父集,所以能兼容GBK不能编码的字符。

链接:https://www.cnblogs.com/yestreenstars/p/5524631.html

posted @ 2019-04-29 19:06  一颗吃不完的糖  阅读(2234)  评论(0编辑  收藏  举报