字符编码发展史
字符编码
计算机内部存储是以二进制数字的形式存储的
单位换算
比特位bit(二进制的个数)
8bit = 1byts(字节)
1024bytes = 1KB
1024KB = 1MB
1024MB = 1GB
1024GB = 1TB
...
字符编码表
规定人类的字符与数字之间的对应关系
>>> res = '驱蚊器问问去夫七五'
>>> res.encode('gbk')
b'\xc7\xfd\xce\xc3\xc6\xf7\xce\xca\xce\xca\xc8\xa5\xb7\xf2\xc6\xdf\xce\xe5'
字符编码发展史
'''
文本文件统一编码用utf8
'''
字符编码实操
1:核心
什么存什么取
2:编码与解码
编码:
将人类的字符按照指定的编码转换成计算机能识别的数据
encode()
解码:
将计算机能识别的字符转换成人类能够读懂的字符
decode()
>>> res = '驱蚊器问问去夫七五'
>>> res.encode('gbk')
b'\xc7\xfd\xce\xc3\xc6\xf7\xce\xca\xce\xca\xc8\xa5\xb7\xf2\xc6\xdf\xce\xe5'
>>> res = b'\xc7\xfd\xce\xc3\xc6\xf7\xce\xca\xce\xca\xc8\xa5\xb7\xf2\xc6\xdf\xce\xe5'
>>> res.decode('gbk')
'驱蚊器问问去夫七五'
'''
上述这种类型:字节型,bytes
'''
3:python解释器默认编码
python2默认的编码是ASCII码
在python2中定义字符串在前面加一个字母 u
文件头指定编码
# -*- conding:utf8 -*-
>>> name = u'lyh'
>>> name
u'lyh'
python3默认的是 utf8