python3 数据类型

一、可变与不可类型

1、七大类数据类型

  • Numbers(数字)(整型int、浮点型float、bool布尔、complex复数)
  • String(字符串)
  • List(列表)
  • Tuple(元组)
  • Dictionary(字典)
  • Set(集合)和 冻结集合(Frozen Set)
  • bytes (字节)、字节数组(bytearray)

2、可变(mutable) 和 不可变(immutable) 类型

1、可变数据类型:

创建后可以修改,对象内存地址不变

值发生改变时,内存地址不变,即id不变,证明在改变原值。

列表 list(如 [1, 2, 3]

字典 dict(如 {"a": 1, "b": 2}

集合 set(如 {1, 2, 3}

字节数组(Byte Array)bytearray(可变的字节序列,如 bytearray(b"hello")

用户自定义类 用户定义的类实例默认是可变对象(除非显式实现不可变性)。

2、不可变类型:

创建后不能被修改,修改时会创建新对象

值发生改变时,内存地址也发生改变,即id也变,证明是没有在改变原值,是产生了新的值。

数字(Numeric)

  • int(整数,如 5
  • float(浮点数,如 3.14
  • complex(复数,如 1+2j
  • bool(布尔值,是 int 的子类,True/False

字符串 str(如 "hello"

元组 tuple(如 (1, 2, 3),但元组内的可变对象可修改,如元组中的列表)

冻结集合 frozenset(不可变的集合,如 frozenset({1, 2})

字节 bytes(如 b"hello"

二、数字类型

1、数字(Numeric)

  • int(整数,如 5
  • float(浮点数,如 3.14
  • complex(复数,如 1+2j
  • bool(布尔值,是 int 的子类,True/False

2、Python3 中,bool 是 int 的子类

True 和 False 可以和数字相加, True==1、False==0 会返回 True,但可以通过 is 来判断类型。

>>> issubclass(bool, int) 
True
>>> True==1
True
>>> False==0
True
>>> True+1
2
>>> False+1
1
>>> 1 is True
False
>>> 0 is False
False

可用type和isinstance(x,y)进行判断

>>> a=12

>>> type(a)
<class 'int'>

>>> isinstance(a,int)
True

3、输出两位小数

方式1 : 使用字符串的 format 方法

price = 10.56789
formatted_price = "{:.2f}".format(price)
print(formatted_price)  # 输出:10.57

方式2: 使用 f-string 格式化字符串(Python 3.6+)

price = 10.56789
formatted_price = f"{price:.2f}"
print(formatted_price)  # 输出:10.57

方式3: 使用 % 运算符

price = 10.56789
formatted_price = "%.2f" % price
print(formatted_price)  # 输出:10.57

三、字符串 string

1、字符串用单引号 ' 或双引号 " 括起来

同时使用反斜杠 \ 转义特殊字符。

加号 + 是字符串的连接符, 星号 * 表示复制当前字符串,与之结合的数字为复制的次数,同时支持索引截取

str = 'Runoob'
print (str)          # 输出字符串
print (str[0:-1])    # 输出第一个到倒数第二个的所有字符
print (str[0])       # 输出字符串第一个字符
print (str[2:])      # 输出从第三个开始的后的所有字符
print (str * 2)      # 输出字符串两次,也可以写成 print (2 * str)
print (str + "TEST") # 连接字符串

2、内置方法:

.strip()方法可以用于去除字符串两端的空白字符(包括空格、制表符、换行符等)。它会返回去除空白字符的新字符串。

.join()方法,将可迭代的对象,迭代后使用指定的字符进行拼接

hobby = ['hejiu', 'chouyan', 'majiang']
a = ', '.join(hobby)
print(a, type(a)) # hejiu, chouyan, majiang <class 'str'>

str的内置方法中.is开头的都是判断,返回布尔值。如:

  • str.isalnum() 所有字符都是数字或者字母
  • str.isalpha() 所有字符都是字母
  • str.isdigit() 所有字符都是数字
  • str.isspace() 所有字符都是空白字符、t、n、r

四、列表 list

1、列表写在方括号 [ ] 之间、用逗号分隔开的元素列表。

列表可以完成大多数集合类的数据结构实现。列表中元素的类型可以不相同,它支持数字,字符串甚至可以包含列表(所谓嵌套)。

和字符串一样,列表同样可以被索引和截取,列表被截取后返回一个包含所需元素的新列表。

列表截取的语法格式如下:

注意:带-的下标,list[:-3]表示从左边-3索引位置开始到结束,list也支持:+ 列表连接运算符, *  重复操作。

list = [ 'abcd', 786 , 2.23, 'runoob', 70.2 ]
tinylist = [123, 'runoob']

print (list[:-3])       # 从第二个开始输出到第三个元素
print (list[2:])        # 输出从第三个元素开始的所有元素
print (tinylist * 2)    # 输出两次列表
print (list + tinylist) # 连接列表

注意:

  • List写在方括号之间,元素用逗号隔开。
  • 和字符串一样,list可以被索引和切片。
  • List可以使用+操作符进行拼接。
  • List中的元素是可以改变的(支持很多方法来增删改查)。

2、list的内置方法

extend 

将一个可迭代对象一次性扩充到一个列表中

list.extend(iterable)

五、元组 tuple

1、元组是不可修改元素的列表

元组写在小括号 () 里,元素之间用逗号隔开。元组中的元素类型也可以不相同:

tuple = ( 'abcd', 786 , 2.23, 'runoob', 70.2  )
tinytuple = (123, 'runoob')

print (tuple[2:])         # 输出从第三个元素开始的所有元素
print (tinytuple * 2)     # 输出两次元组
print (tuple + tinytuple) # 连接元组

虽然tuple的元素不可改变,但它可以包含可变的对象,比如list列表。

构造包含 0 个或 1 个元素的元组比较特殊,所以有一些额外的语法规则:

tup1 = ()    # 空元组
tup2 = (20,) # 一个元素,需要在元素后添加逗号

注意:

  • 1、与字符串一样,元组的元素不能修改。
  • 2、元组也可以被索引和切片,方法一样。
  • 3、注意构造包含 0 或 1 个元素的元组的特殊语法规则。
  • 4、元组也可以使用+操作符进行拼接。

六、字典 dictionary

1、字典是一种映射类型,字典用 { } 标识,它是一个键(key) : 值(value) 的集合。

列表是有序的对象集合,字典是无序的对象集合。两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通过偏移存取。

键(key)必须使用不可变类型。在同一个字典中,键(key)必须是唯一的。

dict = {}
dict['one'] = "1111"
dict[2]     = "2222"

tinydict = {'name': 'runoob','code':1, 'site': 'www.runoob.com'}

print (dict['one'])       # 输出键为 'one' 的值
print (dict[2])           # 输出键为 2 的值
print (tinydict)          # 输出完整的字典
print (tinydict.keys())   # 输出所有键
print (tinydict.values()) # 输出所有值

注意:

  • 字典是一种映射类型,它的元素是键值对。
  • 字典的关键字必须为不可变类型,且不能重复。
  • 创建空字典使用 { }

2、字典解包 {**dict1} 

Python中,{**dict1} 是一种字典解包的用法,它允许将一个字典 dict1 解包成一个新的字典。

dict1 = {'a': 1, 'b': 2}
dict2 = {'c': 3, 'd': 4}

merged_dict = {**dict1, **dict2}
print(merged_dict) #{'a': 1, 'b': 2, 'c': 3, 'd': 4}

3、字典的内置方法

.get() (# ps:字典取值建议使用get方法)

>>> dic= {'k1':'jason','k2':'Tony','k3':'JY'}
>>> dic.get('k1')
'jason'                    # key存在,则获取key对应的value值
>>> res=dic.get('xxx')     # key不存在,不会报错而是默认返回None
>>> print(res)
None  
>>> res=dic.get('xxx',666) # key不存在时,可以设置默认返回的值
>>> print(res)
666 

.pop()

>>> dic= {'k1':'jason','k2':'Tony','k3':'JY'}
>>> v = dic.pop('k2')  # 删除指定的key对应的键值对,并返回值
>>> dic
{'k1': 'jason', 'kk2': 'JY'}
>>> v
'Tony'

.popitem()

>>> dic= {'k1':'jason','k2':'Tony','k3':'JY'}
>>> item = dic.popitem()  # 随机删除一组键值对,并将删除的键值放到元组内返回
>>> dic
{'k3': 'JY', 'k2': 'Tony'}
>>> item
('k1', 'jason')

.update()

 # 用新字典更新旧字典,有则修改,无则添加
>>> dic= {'k1':'jason','k2':'Tony','k3':'JY'}
>>> dic.update({'k1':'JN','k4':'xxx'})
>>> dic
{'k1': 'JN', 'k3': 'JY', 'k2': 'Tony', 'k4': 'xxx'}

支持只更新其中一部分的 v 值

my_dict = {'key1': 'value1', 'key2': 'value2', 'key3': 'value3'}

# 更新字典中的 'key2' 键的值
my_dict.update({'key2': 'new_value'})

# 输出更新后的字典
print(my_dict)
# 输出: {'key1': 'value1', 'key2': 'new_value', 'key3': 'value3'}

# 更新字典中的 'key4' 键的值
my_dict.update({'key4': 'new_value'})

# 输出更新后的字典
print(my_dict)
# 输出: {'key1': 'value1', 'key2': 'new_value', 'key3': 'value3', 'key4': 'new_value'}

.fromkeys()

>>> dic = dict.fromkeys(['k1','k2','k3'],[])
>>> dic
{'k1': [], 'k2': [], 'k3': []}

.setdefault()

# key不存在则新增键值对,并将新增的value返回
>>> dic={'k1':111,'k2':222}
>>> res=dic.setdefault('k3',333)
>>> res
333
>>> dic # 字典中新增了键值对
{'k1': 111, 'k3': 333, 'k2': 222}

# key存在则不做任何修改,并返回已存在key对应的value值
>>> dic={'k1':111,'k2':222}
>>> res=dic.setdefault('k1',666)
>>> res
111
>>> dic # 字典不变
{'k1': 111, 'k2': 222}

应用:按照一天的时间操作

date_str 是一个 '%Y%m%d' 日期格式,有这一天就添加doc。没有则增加key为date_str ,值为 [],再追加doc
就实现了同一天的doc在同一个列表里面

 

    docs_by_day = {}
    for doc in docs:
        try:
            doc_time = doc['DOC_TIME']
            if isinstance(doc_time, str):
                doc_time = datetime.strptime(doc_time, '%Y-%m-%d %H:%M:%S')
            date_str = doc_time.strftime('%Y%m%d')
            docs_by_day.setdefault(date_str, []).append(doc)
        except Exception as e:
            logging.warning(f"Invalid DOC_TIME: {doc.get('DOC_TIME')} - {e}")

4、字典的补充

字典的key值必须可hash,即字典的key值必须是不可变数据类型

Python 的字典是有序的(Python 3.7+)

  • Python 3.7+ 中,字典默认保持插入顺序(Python 3.6 是 CPython 的实现细节,3.7 开始成为语言规范)。

  • 实现原理:

    • 旧版本:通过哈希表(随机顺序)。

    • 新版本:哈希表 + 动态数组(PyPy 先实现,后 CPython 采用)。

      • 哈希表解决快速查找(O(1))。

      • 动态数组按插入顺序存储键值对的引用(保证顺序)。

七、集合 set

1、集合(set)是一个无序的不重复元素序列

可以使用大括号 { } 或者 set() 函数创建集合。构成集合的事物或对象称作元素或是成员

基本功能是进行成员关系测试和删除重复元素。

注意:创建一个空集合必须用 set() 而不是 { },因为 { } 是用来创建一个空字典。

创建格式

parame = {value01,value02,...}
或者
set(value)

集合(set)是由一个或数个形态各异的大小整体组成的,构成集合的事物或对象称作元素或是成员。

基本功能是进行成员关系测试和删除重复元素。

可以使用大括号 { } 或者 set() 函数创建集合,注意:创建一个空集合必须用 set() 而不是 { },因为 { } 是用来创建一个空字典。

注:所有的数据类型创建空时候,都可以用单词名称+(),如 set(),list(), dict()

2、冻结集合(Frozen Set)不可变集合

frozenset(不可变的集合,如 frozenset({1, 2})) 

3、集合的内置方法

# 1.合集/并集(|):求两个用户所有的好友(重复好友只留一个)
>>> friends1 | friends2
{'kevin', 'ricky', 'zero', 'ly', 'Jy', 'qq'}

# 2.交集(&):求两个用户的共同好友
>>> friends1 & friends2
{'ly', 'qq'}

# 3.差集(-):
>>> friends1 - friends2 # 求用户1独有的好友
{'kevin', 'zero'}
>>> friends2 - friends1 # 求用户2独有的好友
{'ricky', 'Jy'}

# 4.对称差集(^) # 求两个用户独有的好友们(即去掉共有的好友)
>>> friends1 ^ friends2
{'kevin', 'zero', 'ricky', 'Jy'}

# 5.值是否相等(==)
>>> friends1 == friends2
False

# 6.父集:一个集合是否包含另外一个集合
# 6.1 包含则返回True
>>> {1,2,3} > {1,2}
True
>>> {1,2,3} >= {1,2}
True
# 6.2 不存在包含关系,则返回False
>>> {1,2,3} > {1,3,4,5}
False
>>> {1,2,3} >= {1,3,4,5}
False

# 7.子集
>>> {1,2} < {1,2,3}
True
>>> {1,2} <= {1,2,3}
True

集合去重会打乱顺序,写一个代码实现既去重又保留之前的顺序

# 针对不可变类型,并且保证顺序则需要我们自己写代码实现,例如
l=[
    {'name':'lili','age':18,'sex':'male'},
    {'name':'jack','age':73,'sex':'male'},
    {'name':'tom','age':20,'sex':'female'},
    {'name':'lili','age':18,'sex':'male'},
    {'name':'lili','age':18,'sex':'male'},
]

new_l=[]

for dic in l:
    if dic not in new_l:
        new_l.append(dic)

print(new_l)
# 结果:既去除了重复,又保证了顺序,而且是针对不可变类型的去重
[
    {'age': 18, 'sex': 'male', 'name': 'lili'}, 
    {'age': 73, 'sex': 'male', 'name': 'jack'}, 
    {'age': 20, 'sex': 'female', 'name': 'tom'}
]

八、字节和字节数组

1、字节 bytes 特点

  • 不可变(immutable):创建后不能修改,类似 str 和 tuple

  • 存储范围:每个元素是一个 0~255 的整数(即一个字节)。

  • 字面量表示:前缀 b,如 b"hello"

  • 适用场景:读取二进制文件(如图片、音频)、网络通信(原始数据)、加密数据等。

2、字节创建方式

# 1. 直接使用 b 前缀
b1 = b"hello"  # 字节字面量

# 2. 通过 bytes() 构造函数
b2 = bytes([104, 101, 108, 108, 111])  # 从整数列表创建
b3 = bytes("hello", encoding="utf-8")  # 从字符串编码

# 3. 从十六进制字符串
b4 = bytes.fromhex("68 65 6c 6c 6f")  # b"hello"

3、字节常用操作

# 访问单个字节(返回整数)
print(b1[0])  # 104(ASCII 'h')

# 切片(返回新的 bytes)
print(b1[1:3])  # b"el"

# 转换为字符串
s = b1.decode("utf-8")  # "hello"

# 遍历字节
for byte in b1:
    print(byte)  # 104, 101, 108, 108, 111

4、字节数组 bytearray特点

  • 可变(mutable):类似 list,可以修改内容。

  • 存储范围:同样每个元素是 0~255 的整数。

  • 适用场景:需要动态修改二进制数据(如协议解析、缓冲区操作)。

5、字节数组创建方式

# 1. 直接使用 bytearray() 构造函数
ba1 = bytearray(b"hello")

# 2. 从整数列表
ba2 = bytearray([104, 101, 108, 108, 111])

# 3. 从字符串编码
ba3 = bytearray("hello", encoding="utf-8")

6、字节数组常用操作

# 修改字节(通过索引)
ba1[0] = 72  # 修改第一个字节为 'H'(ASCII 72)
print(ba1)  # b"Hello"

# 追加字节
ba1.append(33)  # 追加 '!'(ASCII 33)
print(ba1)  # b"Hello!"

# 切片赋值
ba1[1:3] = b"aa"
print(ba1)  # b"Haaao!"

# 转换为 bytes(不可变)
b_fixed = bytes(ba1)  # b"Haaao!" 

7、应用场景

7.1 文件读写(二进制模式)

# 读取图片(bytes)
with open("image.png", "rb") as f:
    data = f.read()  # bytes 类型

# 修改后写入(bytearray)
ba_data = bytearray(data)
ba_data[0] = 0xFF  # 修改第一个字节
with open("modified.png", "wb") as f:
    f.write(ba_data) 

7.2 网络通信(Socket)

import socket

# 发送 bytes
sock.send(b"GET / HTTP/1.1\r\nHost: example.com\r\n\r\n")

# 接收数据并修改(bytearray)
data = bytearray(sock.recv(1024))
data[0] = 0x00  # 修改数据

7.3 加密/编码

import hashlib

# 计算哈希(输入需为 bytes)
hash_obj = hashlib.sha256(b"hello")
print(hash_obj.hexdigest())

8、注意事项

索引访问返回整数

b = b"abc"
print(b[0])  # 97(ASCII 'a'),不是 b"a"

不能直接存储非 ASCII 字符

# b"你好" ❌ 错误(需编码)
b_correct = "你好".encode("utf-8")  # ✅

bytearray 不能用作字典 key(因为可变)

 

 

 

Auto Copied
posted @ 2022-06-02 16:58  凡人半睁眼  阅读(1084)  评论(0)    收藏  举报