编码规则的笔记--python

字符编码
支持中文的第一张表就叫 GB2312;

1980年 gb2312 6700+ 汉字;
1995年 gbk1.0 20000+ 汉字;
2000年 gb18030 27000+ 汉字; 
big5 台湾;

unicode 万国码 支持所有国家和地区的编码; 
2**16 = 65535 = 存一个字符 统一占用2个字节;

UTF-8 = unicode 的扩展集,可变长的字符编码集;考虑了英文和中文等不同之处;

Assic -->Gb2312 ->gbk1.0-->gb18030; 
Assic -->unicode -->utf-8 /utf-16 ;


Python2.x == Assic 默认编码,默认不支持中文;
python3.x == unicode默认编码,默认支持中文;

unicode 是向下兼容gb2312 , gbk;

posted @ 2020-05-25 15:00  爱学习的大叔  阅读(10)  评论(0)    收藏  举报