编码

ASCII最早的编码集,大小写字符,特殊符号,8位1字节,不含中文。

GBK,包含ascII,英文 1字节  8位,包含中文,16位2字节

unicode 万国码 ,全部2个字节 16位

utf-8 可变编码 ,英文 1字节 8位,欧洲 2字节 16位,亚洲 3字节 24位

编码

str.encode()

sl = "六月_海动"
sl_b = sl.encode("utf-8")
print(sl_b)                   # b'\xe5\x85\xad\xe6\x9c\x88_\xe6\xb5\xb7\xe5\x8a\xa8'
s2= "AaBb123"
s2_b = s2.encode("utf-8")
print(s2_b)                   #  b'AaBb123'

解码

str.decode()

b1 = b'\xe5\x85\xad\xe6\x9c\x88_\xe6\xb5\xb7\xe5\x8a\xa8'
print(b1.decode("utf-8"))       #六月_海动
b2 = b'AaBb123'
print(b2.decode("utf-8"))       #AaBb123

用不同的编码字符集编码再解码后,汉字一般会出错。

应用场景:文件操作,网络传输,网络编程

 

posted on 2019-01-08 21:37  六月_海动  阅读(63)  评论(0)    收藏  举报