python之字符编码
python编码问题学习笔记
二进制
--->ASCII:只能存英文和拉丁字符。
--->gb2312:只能存6700多个中文,1980年。
--->gbk1.0:能存2万多个字符,1995年。
--->gb18030:能存27000多个字符,2000年。
--->unicode:utf-32:一个字符占4个字节。
--->unicode:utf-16:一个字符占2个或2个以上字节。
--->unicode:utf-8:一个英文字符用ASCII码来存,一个中文占3个字节。
编码encode
解码decode
python中是如何进行编码的?
python2
在Python2中,默认编码是ASCII编码。
GBK要转换为utf-8:
1、首先通过解码(decode)转换为unicode编码。
2、然后通过编码(encode)转换为utf-8编码。
python3
在Python2中,默认编码是unicode编码。
encode 在编码的同时,会把数据转换为bytes类型。
decode 在解码的同时,会把bytes类型转换成字符串。

浙公网安备 33010602011771号