字符编码解码

二进制

  ASCII :只能存英文和拉丁字符,一个字符占一个字节,8位

    gb2312:只能存6700多个中文, 1980

      gbk1.0:存了2万多字符,     1995

        gb18030:2000, 27000中文

 

  unicode:utf-32:一个字符占4个字节

  unicode:utf-16:一个字符占2个字节或2个以上,65535

  unicode:utf-8:一个英文用ASCII码来存,一个中文占3个字节

 

编码(encode)

解码(decode)

 

in python2

默认是ASCII码

 

posted @ 2018-06-20 21:55  evatan123  阅读(112)  评论(0编辑  收藏  举报