# 2.bytes
# 程序员平时遇到的所有的数据最终单位都是byte字节(0111000)__0和1表示1位
#
# s = "周杰伦"
# bs1 = s.encode('gbk') # b`XXXX`bytes类型,其中每一个[\X]表示一个字节
# # 把s翻译成gbk编码
# bs2 = s.encode('utf-8')
# # 把s翻译成utf-8编码
# print(bs1, '\n', bs2)
# 怎么把gbk的字节转化成一个utf-8的字节
bs = b'\xd6\xdc\xbd\xdc\xc2\xd7'
s = bs.decode("gbk") # 解码,变成中文,以文字作为媒介
bs2 = s.encode('utf-8') # 重新编码
print(s)
print(bs2)
# 1.str.encode("编码") 进行编码
# 2.bytes.decode("编码") 进行解码
sn = "你好sbc哈啊啊"
# /b'\xc4\xe3\xba\xc3sbc\xb9\xfe\xb0\xa1\xb0\xa1'(结果是这个,因为
# 都是以ASCII码的扩充进行编码的,sbc,可以直接显示转化)
# { 如:00000000 01100001
# 01100001
# 以上两个都是一样的,多的那些0000000可要可不要}
print(sn.encode('gb2312'))