python之chardet验证编码格式

在处理字符串时,常常会遇到不知道字符串是何种编码,如果不知道字符串的编码就不能将字符串转换成需要的编码

pip install chardet

举例子

import chardet
import urllib.request     ---->安装urllib3

# 可根据需要,选择不同的数据
TestData = urllib.request.urlopen('http://www.baidu.com/').read(300)
print(chardet.detect(TestData))

# 运行结果:{'encoding': 'ascii', 'confidence': 1.0, 'language': ''}

注:

rllib2是python自带的模块,不需要下载。

urllib 侧重于 url 基本的请求构造,urllib2侧重于 http 协议请求的处理,而 urllib3是服务于升级的http 1.1标准,且拥有高效 http连接池管理及 http 代理服务的功能库

posted on 2019-01-24 17:52  V神丫丫  阅读(235)  评论(0编辑  收藏  举报