初始编码
初始编码
电脑的传输和储存实际上都是010101010101
1、美国:ascii码,2**8=256种可能,但是常用的中文储存不了
最开始是设置7位,最后确定是八位,八位就表示一个字节,所以ascii码最前面那位都是0,因为7位就够用了
00000001 8位 bit==1字节(byte)
1024个字节(byte) == 1kb
1024kb == 1MB
1024MB == 1GB
1024GB == 1TB
2、为了解决全球化的文字问题,创建了一个万国码,unicode
1个字节表示所有的单个英文,数字,特殊字符
起初设置的是2个字节表示一个中文,后面拓展的是4个字节表示一个中文,也就是32位,但是有点浪费,就有了后面的升级版utf-8
3、UTF-8(常用)
一个中文用3个字节去表示
python2默认是ascii码的编码方式,所有打印中文会报错,因为包含不了,python3是utf-8的编码方式
4、gbk
只包含中文和英文,不包含其他语言,这是中国自己发明的编码方式
一个中文用两个字节去表示,但是也没办法包含所有的中文

浙公网安备 33010602011771号