python之字符编码

python编码问题学习笔记

二进制

--->ASCII:只能存英文和拉丁字符。

--->gb2312:只能存6700多个中文,1980年。

--->gbk1.0:能存2万多个字符,1995年。

--->gb18030:能存27000多个字符,2000年。

--->unicode:utf-32:一个字符占4个字节。

--->unicode:utf-16:一个字符占2个或2个以上字节。

--->unicode:utf-8:一个英文字符用ASCII码来存,一个中文占3个字节。

编码encode 

解码decode   

 

python中是如何进行编码的?

python2

在Python2中,默认编码是ASCII编码。

GBK要转换为utf-8:

1、首先通过解码(decode)转换为unicode编码。

2、然后通过编码(encode)转换为utf-8编码。                                                                          

python3

 在Python2中,默认编码是unicode编码。

encode  在编码的同时,会把数据转换为bytes类型。

decode  在解码的同时,会把bytes类型转换成字符串。

 

                                      

posted @ 2018-02-22 16:28  紫柏之梦  阅读(55)  评论(0)    收藏  举报