BeautifulSoup获取网页为乱码的解决
1、扒取网页
req = requests.get(url = target)
html = req.text
bf = BeautifulSoup(html,'html.parser')
texts = bf.find_all('a')
print(texts)
2、输出结果

3、F12查看原页面
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
4、估计是默认使用的编码不对,页面内容取回后先指定解码方式,试试。
代码:
req = requests.get(url = target)
req.encoding='utf-8' #指定编码格式,解决中文乱码显示
html = req.text
bf = BeautifulSoup(html,'html.parser')
texts = bf.find_all('a')
print(texts)
结果:

5、问题解决

浙公网安备 33010602011771号