编码
ASCII最早的编码集,大小写字符,特殊符号,8位1字节,不含中文。
GBK,包含ascII,英文 1字节 8位,包含中文,16位2字节
unicode 万国码 ,全部2个字节 16位
utf-8 可变编码 ,英文 1字节 8位,欧洲 2字节 16位,亚洲 3字节 24位
编码
str.encode()
sl = "六月_海动" sl_b = sl.encode("utf-8") print(sl_b) # b'\xe5\x85\xad\xe6\x9c\x88_\xe6\xb5\xb7\xe5\x8a\xa8' s2= "AaBb123" s2_b = s2.encode("utf-8") print(s2_b) # b'AaBb123'
解码
str.decode()
b1 = b'\xe5\x85\xad\xe6\x9c\x88_\xe6\xb5\xb7\xe5\x8a\xa8' print(b1.decode("utf-8")) #六月_海动 b2 = b'AaBb123' print(b2.decode("utf-8")) #AaBb123
用不同的编码字符集编码再解码后,汉字一般会出错。
应用场景:文件操作,网络传输,网络编程
浙公网安备 33010602011771号