chardet检测文本的编码格式
chardet的适用场景:
- 不知道所捕获对象的文本格式 ---> chardet函数包检测所捕获文本格式
import chardet
import requests
res=requests.get("http://www.baidu.com")
content=res.content
# 打印 chardet 解析文本结果
# result: {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
print(chardet.detect(content))
with open("baidu.txt","w") as f:
encodes=chardet.detect(content).get("encoding")
f.write(content.decode(encodes))
# 输出结果:
# {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
# 编码格式:utf-8, 占比权重:0.99

浙公网安备 33010602011771号