(爬虫)通用处理中文乱码的解决方案
requests.get(url,headers).content.encode('iso-8859-1').decode('gbk')
需要注意的是,网站的编码方式可通过head标签里的meta标签查看,对应的编码方式放在decode()中。
content对应图像数据,text对应文本数据
requests.get(url,headers).content.encode('iso-8859-1').decode('gbk')
需要注意的是,网站的编码方式可通过head标签里的meta标签查看,对应的编码方式放在decode()中。
content对应图像数据,text对应文本数据