chardet检测文本的编码格式

 

chardet的适用场景:

  1.  不知道所捕获对象的文本格式    ---> chardet函数包检测所捕获文本格式
import chardet
import requests

res=requests.get("http://www.baidu.com")
content=res.content


# 打印 chardet 解析文本结果
# result: {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
print(chardet.detect(content))
with open("baidu.txt","w") as f:
encodes=chardet.detect(content).get("encoding")
f.write(content.decode(encodes))


# 输出结果:
# {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
# 编码格式:utf-8, 占比权重:0.99

 


posted @ 2020-07-30 17:24  这一片斑驳  阅读(267)  评论(0)    收藏  举报