一、编码

1、初识编码

一 ASCII 英文,8为(1字节)表示一个东西,2**8

二 Unicode 万国码,32(4字节)表示一个东西,2**32

三 utf-8,给Unicode压缩,用尽量少的位数表示一个东西,以8个位为单位

最少一个字节,最多4个字节 中文:3字节=24位表示

四 gdk 支持中文

2、 python解释器编码

py2:ASCII, 若要支持py3在文件头部加:

# -- coding:utf-8 --

print(‘你好’)

py3: utf-8

3 、文件编码

建议 保存的时候使用utf-8保存

4、位(bit):

是计算机 内部数据 储存的最小单位,11001100是一个八位二进制数。

5、字节(byte):

是计算机中 数据处理 的基本单位,习惯上用大写 B 来表示,1B(byte,字节)= 8bit(位)

6、字符:

是指计算机中使用的字母、数字、字和符号


ASCIIS码: 1个英文字母(不分大小写)= 1个字节的空间

1个中文汉字 = 2个字节的空间

1个ASCII码 = 一个字节

UTF-8编码:1个英文字符 = 1个字节

英文标点 = 1个字节

1个中文(含繁体) = 3个字节

中文标点 = 3个字节

Unicode编码:1个英文字符 = 2个字节

英文标点 = 2个字节

1个中文(含繁体) = 2个字节

中文标点 = 2个字节

 

posted @ 2019-09-30 10:00  大大的西红柿  阅读(211)  评论(0)    收藏  举报