一、编码
1、初识编码
一 ASCII 英文,8为(1字节)表示一个东西,2**8
二 Unicode 万国码,32(4字节)表示一个东西,2**32
三 utf-8,给Unicode压缩,用尽量少的位数表示一个东西,以8个位为单位
最少一个字节,最多4个字节 中文:3字节=24位表示
四 gdk 支持中文
2、 python解释器编码
py2:ASCII, 若要支持py3在文件头部加:
# -- coding:utf-8 --
print(‘你好’)
py3: utf-8
3 、文件编码
建议 保存的时候使用utf-8保存
4、位(bit):
是计算机 内部数据 储存的最小单位,11001100是一个八位二进制数。
5、字节(byte):
是计算机中 数据处理 的基本单位,习惯上用大写 B 来表示,1B(byte,字节)= 8bit(位)
6、字符:
是指计算机中使用的字母、数字、字和符号
ASCIIS码: 1个英文字母(不分大小写)= 1个字节的空间
1个中文汉字 = 2个字节的空间
1个ASCII码 = 一个字节
UTF-8编码:1个英文字符 = 1个字节
英文标点 = 1个字节
1个中文(含繁体) = 3个字节
中文标点 = 3个字节
Unicode编码:1个英文字符 = 2个字节
英文标点 = 2个字节
1个中文(含繁体) = 2个字节
中文标点 = 2个字节

浙公网安备 33010602011771号