python字符编码

python3 文件里面默认编码 是utf-8
字符串 编码是 Unicode

python2 文件默认是编码 是ascii
字符串 编码 默认是ascii
如果文件头声明gbk 那字符串的编码就是gbk

Unicode 是单独类型

 1 方法是 decode(编码) 和 encode(编码)
 2 UTF-8  -->> decode 解码 -->>  Unicode
 3 Unicode   -->> encode(编码)   -->>  GBK/UTF08
 4 
 5 编码
 6 字节,位
 7     unicode  utf8 gbk
 8     utf8  3个字节
 9     gbk   2 个字节
10     
11     
12 
13 
14 print(s1)
15 s5 = s1.decode("utf-8")
16 print(s5)
17 print(type(s5))
18 
19 s6 = s5.encode('gbk')
20 print(s6)
21 print(type(s6))
22 
23 s7 = s5.encode("utf-8")
24 print(s7)
25 print(type(s7))
26 
27 
28 gbk  -->> decode(解码)  -->>  unicode   -->> encode(编码)  -->> shift-jis  日本编码
29 gbk  <<-- encode(编码)  <<--  Unicode   <<-- decode(解码)  <<-- shift-jis  日本编码

 

posted @ 2019-01-30 23:01  Boks  阅读(125)  评论(0)    收藏  举报