初始编码

初始编码

电脑的传输和储存实际上都是010101010101

1、美国:ascii码,2**8=256种可能,但是常用的中文储存不了

最开始是设置7位,最后确定是八位,八位就表示一个字节,所以ascii码最前面那位都是0,因为7位就够用了

00000001  8位  bit==1字节(byte)

1024个字节(byte) == 1kb

1024kb == 1MB

1024MB == 1GB

1024GB == 1TB 

2、为了解决全球化的文字问题,创建了一个万国码,unicode

1个字节表示所有的单个英文,数字,特殊字符

起初设置的是2个字节表示一个中文,后面拓展的是4个字节表示一个中文,也就是32位,但是有点浪费,就有了后面的升级版utf-8

3、UTF-8(常用)

一个中文用3个字节去表示

python2默认是ascii码的编码方式,所有打印中文会报错,因为包含不了,python3是utf-8的编码方式

4、gbk

只包含中文和英文,不包含其他语言,这是中国自己发明的编码方式

一个中文用两个字节去表示,但是也没办法包含所有的中文

 

posted @ 2021-03-20 00:00  吃啥呦?  阅读(162)  评论(0)    收藏  举报