字符集bytes

# 2.bytes
#   程序员平时遇到的所有的数据最终单位都是byte字节(0111000)__0和1表示1位
#
# s = "周杰伦"
# bs1 = s.encode('gbk')  # b`XXXX`bytes类型,其中每一个[\X]表示一个字节
# # 把s翻译成gbk编码
# bs2 = s.encode('utf-8')
# # 把s翻译成utf-8编码
# print(bs1, '\n', bs2)

# 怎么把gbk的字节转化成一个utf-8的字节
bs = b'\xd6\xdc\xbd\xdc\xc2\xd7'
s = bs.decode("gbk")  # 解码,变成中文,以文字作为媒介
bs2 = s.encode('utf-8')  # 重新编码
print(s)
print(bs2)
#  1.str.encode("编码")  进行编码
#  2.bytes.decode("编码")  进行解码
sn = "你好sbc哈啊啊"
# /b'\xc4\xe3\xba\xc3sbc\xb9\xfe\xb0\xa1\xb0\xa1'(结果是这个,因为
# 都是以ASCII码的扩充进行编码的,sbc,可以直接显示转化)
# { 如:00000000  01100001
#    01100001
# 以上两个都是一样的,多的那些0000000可要可不要}
print(sn.encode('gb2312'))

posted @ 2022-05-17 14:48 acwecc 阅读(61) 评论(0) 收藏举报

刷新页面返回顶部

acwecc

字符集bytes

公告