编码规则的笔记--python
字符编码
支持中文的第一张表就叫 GB2312;
1980年 gb2312 6700+ 汉字;
1995年 gbk1.0 20000+ 汉字;
2000年 gb18030 27000+ 汉字;
big5 台湾;
unicode 万国码 支持所有国家和地区的编码;
2**16 = 65535 = 存一个字符 统一占用2个字节;
UTF-8 = unicode 的扩展集,可变长的字符编码集;考虑了英文和中文等不同之处;
Assic -->Gb2312 ->gbk1.0-->gb18030;
Assic -->unicode -->utf-8 /utf-16 ;
Python2.x == Assic 默认编码,默认不支持中文;
python3.x == unicode默认编码,默认支持中文;
unicode 是向下兼容gb2312 , gbk;

浙公网安备 33010602011771号