欢迎来到赛兔子家园

Python bytes类型及用法

Python bytes类型用来表示一个字节串。字节串不是编程术语,用来和字符串相呼应。

字节串(bytes)和字符串(string)对比:

  字符串由若干字符组成,以字符为单位进行操作;字节串由若干字节组成,以字节为单位进行操作。

  字节串和字符串除了操作的数据单元不同之外,它们支持的所有方法都基本相同。

  bytes 只负责以字节序列的形式(二进制形式)来存储数据,至于这些数据到底表示什么内容(字符串、数字、图片、音频等),完全由程序的解析方式决定。如果采用合适的字符编码方式

  (字符集),字节串可以恢复成字符串;反之亦然,字符串也可以转换成字节串。

  说白了,bytes 只是简单地记录内存中的原始数据,至于如何使用这些数据,bytes 并不在意,你想怎么使用就怎么使用,bytes 并不约束你的行为。

  bytes 类型的数据非常适合在互联网上传输,可以用于网络通信编程;bytes 也可以用来存储图片、音频、视频等二进制格式的文件。

  字符串和 bytes 存在着千丝万缕的联系,我们可以通过字符串来创建 bytes 对象,或者说将字符串转换成 bytes 对象。有以下三种方法可以达到这个目的:

  1、如果字符串的内容都是 ASCII 字符,那么直接在字符串前面添加b前缀就可以转换成 bytes。

  2、bytes 是一个类,调用它的构造方法,也就是 bytes(),可以将字符串按照指定的字符集转换成 bytes;如果不指定字符集,那么默认采用 UTF-8。

  3、字符串本身有一个 encode() 方法,该方法专门用来将字符串按照指定的字符集转换成对应的字节串;如果不指定字符集,那么默认采用 UTF-8。

【实例】使用不同方式创建 bytes 对象:

# 创建空bytes
b1 = bytes()
# 通过空字符串创建 bytes
b2 = b''
# 通过b前缀将字符串转换成bytes
b3 = b'https://www.cnblogs.com/qingchengzi'
print("b3:",b3)
print(b3[3])
print(b3[3:22])

b4 = bytes("赛兔子",encoding="UTF-8")
print("b4",b4)
# encode()方法将字符串转换成bytes
b5 = "赛兔子".encode("UTF-8")
print("b5",b5)

输出结果:

b3: b'https://www.cnblogs.com/qingchengzi'
112
b'ps://www.cnblogs.co'
b4 b'\xe8\xb5\x9b\xe5\x85\x94\xe5\xad\x90'
b5 b'\xe8\xb5\x9b\xe5\x85\x94\xe5\xad\x90'

从运行结果可以发现,对于ASCII 字符,print 输出的是它的字符编码值(十六进制形式),而不是字符本身。非 ASCII 字符一般占用两个字节以上的内存,而 bytes 是按照单个字节来处理数据的,所以不能一次处理多个字节。

bytes 类也有一个 decode() 方法,通过该方法可以将 bytes 对象转换为字符串。紧接上面的程序,添加以下代码:

str = b5.decode("UTF-8")
print("str",str)

输出结果:

str 赛兔子

 

posted on 2024-04-26 11:13  赛兔子  阅读(3)  评论(0编辑  收藏  举报

导航