python3 数据类型

一、可变与不可类型

1、七大类数据类型

Numbers（数字）（整型int、浮点型float、bool布尔、complex复数）
String（字符串）
List（列表）
Tuple（元组）
Dictionary（字典）
Set（集合）和冻结集合（Frozen Set）
bytes （字节）、字节数组（bytearray）

2、可变（mutable）和不可变（immutable）类型

1、可变数据类型：

创建后可以修改，对象内存地址不变

值发生改变时，内存地址不变，即id不变，证明在改变原值。

列表 list（如 [1, 2, 3]）

字典 dict（如 {"a": 1, "b": 2}）

集合 set（如 {1, 2, 3}）

字节数组（Byte Array）bytearray（可变的字节序列，如 bytearray(b"hello")）

用户自定义类 用户定义的类实例默认是可变对象（除非显式实现不可变性）。

2、不可变类型：

创建后不能被修改，修改时会创建新对象

值发生改变时，内存地址也发生改变，即id也变，证明是没有在改变原值，是产生了新的值。

数字（Numeric）

int（整数，如 5）

float（浮点数，如 3.14）

complex（复数，如 1+2j）

bool（布尔值，是 int 的子类，True/False）

字符串 str（如 "hello"）

元组 tuple（如 (1, 2, 3)，但元组内的可变对象可修改，如元组中的列表）

冻结集合 frozenset（不可变的集合，如 frozenset({1, 2})）

字节 bytes（如 b"hello"）

二、数字类型

1、数字（Numeric）

int（整数，如 5）

float（浮点数，如 3.14）

complex（复数，如 1+2j）

bool（布尔值，是 int 的子类，True/False）

2、Python3 中，bool 是 int 的子类

True 和 False 可以和数字相加， True==1、False==0 会返回 True，但可以通过 is 来判断类型。

>>> issubclass(bool, int) 
True
>>> True==1
True
>>> False==0
True
>>> True+1
2
>>> False+1
1
>>> 1 is True
False
>>> 0 is False
False

可用type和isinstance(x,y)进行判断

>>> a=12

>>> type(a)
<class 'int'>

>>> isinstance(a,int)
True

3、输出两位小数

方式1 : 使用字符串的 format 方法

price = 10.56789
formatted_price = "{:.2f}".format(price)
print(formatted_price)  # 输出：10.57

方式2: 使用 f-string 格式化字符串（Python 3.6+）

price = 10.56789
formatted_price = f"{price:.2f}"
print(formatted_price)  # 输出：10.57

方式3: 使用 % 运算符

price = 10.56789
formatted_price = "%.2f" % price
print(formatted_price)  # 输出：10.57

三、字符串 string

1、字符串用单引号 ' 或双引号 " 括起来

同时使用反斜杠 \ 转义特殊字符。

加号 + 是字符串的连接符，星号 * 表示复制当前字符串，与之结合的数字为复制的次数，同时支持索引截取

str = 'Runoob'
print (str)          # 输出字符串
print (str[0:-1])    # 输出第一个到倒数第二个的所有字符
print (str[0])       # 输出字符串第一个字符
print (str[2:])      # 输出从第三个开始的后的所有字符
print (str * 2)      # 输出字符串两次，也可以写成 print (2 * str)
print (str + "TEST") # 连接字符串

2、内置方法：

.strip()方法可以用于去除字符串两端的空白字符(包括空格、制表符、换行符等)。它会返回去除空白字符的新字符串。

.join()方法，将可迭代的对象，迭代后使用指定的字符进行拼接

hobby = ['hejiu', 'chouyan', 'majiang']
a = ', '.join(hobby)
print(a, type(a)) # hejiu, chouyan, majiang <class 'str'>

str的内置方法中.is开头的都是判断，返回布尔值。如：

str.isalnum() 所有字符都是数字或者字母
str.isalpha() 所有字符都是字母
str.isdigit() 所有字符都是数字
str.isspace() 所有字符都是空白字符、t、n、r

四、列表 list

1、列表写在方括号 [ ] 之间、用逗号分隔开的元素列表。

列表可以完成大多数集合类的数据结构实现。列表中元素的类型可以不相同，它支持数字，字符串甚至可以包含列表（所谓嵌套）。

和字符串一样，列表同样可以被索引和截取，列表被截取后返回一个包含所需元素的新列表。

列表截取的语法格式如下：

注意：带-的下标，list[:-3]表示从左边-3索引位置开始到结束，list也支持：+ 列表连接运算符， * 重复操作。

list = [ 'abcd', 786 , 2.23, 'runoob', 70.2 ]
tinylist = [123, 'runoob']

print (list[:-3])       # 从第二个开始输出到第三个元素
print (list[2:])        # 输出从第三个元素开始的所有元素
print (tinylist * 2)    # 输出两次列表
print (list + tinylist) # 连接列表

注意：

List写在方括号之间，元素用逗号隔开。
和字符串一样，list可以被索引和切片。
List可以使用+操作符进行拼接。
List中的元素是可以改变的（支持很多方法来增删改查）。

2、list的内置方法

extend

将一个可迭代对象一次性扩充到一个列表中

list.extend(iterable)

五、元组 tuple

1、元组是不可修改元素的列表。

元组写在小括号 () 里，元素之间用逗号隔开。元组中的元素类型也可以不相同：

tuple = ( 'abcd', 786 , 2.23, 'runoob', 70.2  )
tinytuple = (123, 'runoob')

print (tuple[2:])         # 输出从第三个元素开始的所有元素
print (tinytuple * 2)     # 输出两次元组
print (tuple + tinytuple) # 连接元组

虽然tuple的元素不可改变，但它可以包含可变的对象，比如list列表。

构造包含 0 个或 1 个元素的元组比较特殊，所以有一些额外的语法规则：

tup1 = ()    # 空元组
tup2 = (20,) # 一个元素，需要在元素后添加逗号

注意：

1、与字符串一样，元组的元素不能修改。
2、元组也可以被索引和切片，方法一样。
3、注意构造包含 0 或 1 个元素的元组的特殊语法规则。
4、元组也可以使用+操作符进行拼接。

六、字典 dictionary

1、字典是一种映射类型，字典用 { } 标识，它是一个键(key) : 值(value) 的集合。

列表是有序的对象集合，字典是无序的对象集合。两者之间的区别在于：字典当中的元素是通过键来存取的，而不是通过偏移存取。

键(key)必须使用不可变类型。在同一个字典中，键(key)必须是唯一的。

dict = {}
dict['one'] = "1111"
dict[2]     = "2222"

tinydict = {'name': 'runoob','code':1, 'site': 'www.runoob.com'}

print (dict['one'])       # 输出键为 'one' 的值
print (dict[2])           # 输出键为 2 的值
print (tinydict)          # 输出完整的字典
print (tinydict.keys())   # 输出所有键
print (tinydict.values()) # 输出所有值

注意：

字典是一种映射类型，它的元素是键值对。
字典的关键字必须为不可变类型，且不能重复。
创建空字典使用 { }。

2、字典解包 `{**dict1}`

Python中，{**dict1} 是一种字典解包的用法，它允许将一个字典 dict1 解包成一个新的字典。

dict1 = {'a': 1, 'b': 2}
dict2 = {'c': 3, 'd': 4}

merged_dict = {**dict1, **dict2}
print(merged_dict) #{'a': 1, 'b': 2, 'c': 3, 'd': 4}

3、字典的内置方法

.get() (# ps:字典取值建议使用get方法)

>>> dic= {'k1':'jason','k2':'Tony','k3':'JY'}
>>> dic.get('k1')
'jason'                    # key存在，则获取key对应的value值
>>> res=dic.get('xxx')     # key不存在，不会报错而是默认返回None
>>> print(res)
None  
>>> res=dic.get('xxx',666) # key不存在时，可以设置默认返回的值
>>> print(res)
666

.pop()

>>> dic= {'k1':'jason','k2':'Tony','k3':'JY'}
>>> v = dic.pop('k2')  # 删除指定的key对应的键值对,并返回值
>>> dic
{'k1': 'jason', 'kk2': 'JY'}
>>> v
'Tony'

.popitem()

>>> dic= {'k1':'jason','k2':'Tony','k3':'JY'}
>>> item = dic.popitem()  # 随机删除一组键值对,并将删除的键值放到元组内返回
>>> dic
{'k3': 'JY', 'k2': 'Tony'}
>>> item
('k1', 'jason')

.update()

# 用新字典更新旧字典，有则修改，无则添加

>>> dic= {'k1':'jason','k2':'Tony','k3':'JY'}
>>> dic.update({'k1':'JN','k4':'xxx'})
>>> dic
{'k1': 'JN', 'k3': 'JY', 'k2': 'Tony', 'k4': 'xxx'}

支持只更新其中一部分的 v 值

my_dict = {'key1': 'value1', 'key2': 'value2', 'key3': 'value3'}

# 更新字典中的 'key2' 键的值
my_dict.update({'key2': 'new_value'})

# 输出更新后的字典
print(my_dict)
# 输出: {'key1': 'value1', 'key2': 'new_value', 'key3': 'value3'}

# 更新字典中的 'key4' 键的值
my_dict.update({'key4': 'new_value'})

# 输出更新后的字典
print(my_dict)
# 输出: {'key1': 'value1', 'key2': 'new_value', 'key3': 'value3', 'key4': 'new_value'}

.fromkeys()

>>> dic = dict.fromkeys(['k1','k2','k3'],[])
>>> dic
{'k1': [], 'k2': [], 'k3': []}

.setdefault()

# key不存在则新增键值对，并将新增的value返回
>>> dic={'k1':111,'k2':222}
>>> res=dic.setdefault('k3',333)
>>> res
333
>>> dic # 字典中新增了键值对
{'k1': 111, 'k3': 333, 'k2': 222}

# key存在则不做任何修改，并返回已存在key对应的value值
>>> dic={'k1':111,'k2':222}
>>> res=dic.setdefault('k1',666)
>>> res
111
>>> dic # 字典不变
{'k1': 111, 'k2': 222}

应用：按照一天的时间操作

date_str 是一个 '%Y%m%d' 日期格式，有这一天就添加doc。没有则增加key为date_str ，值为 []，再追加doc
就实现了同一天的doc在同一个列表里面

    docs_by_day = {}
    for doc in docs:
        try:
            doc_time = doc['DOC_TIME']
            if isinstance(doc_time, str):
                doc_time = datetime.strptime(doc_time, '%Y-%m-%d %H:%M:%S')
            date_str = doc_time.strftime('%Y%m%d')
            docs_by_day.setdefault(date_str, []).append(doc)
        except Exception as e:
            logging.warning(f"Invalid DOC_TIME: {doc.get('DOC_TIME')} - {e}")

4、字典的补充

字典的key值必须可hash，即字典的key值必须是不可变数据类型

Python 的字典是有序的（Python 3.7+）

Python 3.7+ 中，字典默认保持插入顺序（Python 3.6 是 CPython 的实现细节，3.7 开始成为语言规范）。
实现原理：
- 旧版本：通过哈希表（随机顺序）。
- 新版本：哈希表 + 动态数组（PyPy 先实现，后 CPython 采用）。
  - 哈希表解决快速查找（O(1)）。
  - 动态数组按插入顺序存储键值对的引用（保证顺序）。

七、集合 set

1、集合（set）是一个无序的不重复元素序列。

可以使用大括号 { } 或者 set() 函数创建集合。构成集合的事物或对象称作元素或是成员

基本功能是进行成员关系测试和删除重复元素。

注意：创建一个空集合必须用 set() 而不是 { }，因为 { } 是用来创建一个空字典。

创建格式

parame = {value01,value02,...}
或者
set(value)

集合（set）是由一个或数个形态各异的大小整体组成的，构成集合的事物或对象称作元素或是成员。

基本功能是进行成员关系测试和删除重复元素。

可以使用大括号 { } 或者 set() 函数创建集合，注意：创建一个空集合必须用 set() 而不是 { }，因为 { } 是用来创建一个空字典。

注：所有的数据类型创建空时候，都可以用单词名称+()，如 set()，list(), dict()

2、冻结集合（Frozen Set）不可变集合

frozenset（不可变的集合，如 frozenset({1, 2})）

3、集合的内置方法

# 1.合集/并集(|)：求两个用户所有的好友（重复好友只留一个）
>>> friends1 | friends2
{'kevin', 'ricky', 'zero', 'ly', 'Jy', 'qq'}

# 2.交集(&)：求两个用户的共同好友
>>> friends1 & friends2
{'ly', 'qq'}

# 3.差集(-)：
>>> friends1 - friends2 # 求用户1独有的好友
{'kevin', 'zero'}
>>> friends2 - friends1 # 求用户2独有的好友
{'ricky', 'Jy'}

# 4.对称差集(^) # 求两个用户独有的好友们（即去掉共有的好友）
>>> friends1 ^ friends2
{'kevin', 'zero', 'ricky', 'Jy'}

# 5.值是否相等(==)
>>> friends1 == friends2
False

# 6.父集：一个集合是否包含另外一个集合
# 6.1 包含则返回True
>>> {1,2,3} > {1,2}
True
>>> {1,2,3} >= {1,2}
True
# 6.2 不存在包含关系，则返回False
>>> {1,2,3} > {1,3,4,5}
False
>>> {1,2,3} >= {1,3,4,5}
False

# 7.子集
>>> {1,2} < {1,2,3}
True
>>> {1,2} <= {1,2,3}
True

集合去重会打乱顺序，写一个代码实现既去重又保留之前的顺序

# 针对不可变类型，并且保证顺序则需要我们自己写代码实现，例如
l=[
    {'name':'lili','age':18,'sex':'male'},
    {'name':'jack','age':73,'sex':'male'},
    {'name':'tom','age':20,'sex':'female'},
    {'name':'lili','age':18,'sex':'male'},
    {'name':'lili','age':18,'sex':'male'},
]

new_l=[]

for dic in l:
    if dic not in new_l:
        new_l.append(dic)

print(new_l)
# 结果：既去除了重复，又保证了顺序，而且是针对不可变类型的去重
[
    {'age': 18, 'sex': 'male', 'name': 'lili'}, 
    {'age': 73, 'sex': 'male', 'name': 'jack'}, 
    {'age': 20, 'sex': 'female', 'name': 'tom'}
]

八、字节和字节数组

1、字节 bytes 特点

不可变（immutable）：创建后不能修改，类似 str 和 tuple。
存储范围：每个元素是一个 0~255 的整数（即一个字节）。
字面量表示：前缀 b，如 b"hello"。
适用场景：读取二进制文件（如图片、音频）、网络通信（原始数据）、加密数据等。

2、字节创建方式

# 1. 直接使用 b 前缀
b1 = b"hello"  # 字节字面量

# 2. 通过 bytes() 构造函数
b2 = bytes([104, 101, 108, 108, 111])  # 从整数列表创建
b3 = bytes("hello", encoding="utf-8")  # 从字符串编码

# 3. 从十六进制字符串
b4 = bytes.fromhex("68 65 6c 6c 6f")  # b"hello"

3、字节常用操作

# 访问单个字节（返回整数）
print(b1[0])  # 104（ASCII 'h'）

# 切片（返回新的 bytes）
print(b1[1:3])  # b"el"

# 转换为字符串
s = b1.decode("utf-8")  # "hello"

# 遍历字节
for byte in b1:
    print(byte)  # 104, 101, 108, 108, 111

4、字节数组 `bytearray特点`

可变（mutable）：类似 list，可以修改内容。
存储范围：同样每个元素是 0~255 的整数。
适用场景：需要动态修改二进制数据（如协议解析、缓冲区操作）。

5、字节数组创建方式

# 1. 直接使用 bytearray() 构造函数
ba1 = bytearray(b"hello")

# 2. 从整数列表
ba2 = bytearray([104, 101, 108, 108, 111])

# 3. 从字符串编码
ba3 = bytearray("hello", encoding="utf-8")

6、字节数组常用操作

# 修改字节（通过索引）
ba1[0] = 72  # 修改第一个字节为 'H'（ASCII 72）
print(ba1)  # b"Hello"

# 追加字节
ba1.append(33)  # 追加 '!'（ASCII 33）
print(ba1)  # b"Hello!"

# 切片赋值
ba1[1:3] = b"aa"
print(ba1)  # b"Haaao!"

# 转换为 bytes（不可变）
b_fixed = bytes(ba1)  # b"Haaao!"

7、应用场景

7.1 文件读写（二进制模式）

# 读取图片（bytes）
with open("image.png", "rb") as f:
    data = f.read()  # bytes 类型

# 修改后写入（bytearray）
ba_data = bytearray(data)
ba_data[0] = 0xFF  # 修改第一个字节
with open("modified.png", "wb") as f:
    f.write(ba_data)

7.2 网络通信（Socket）

import socket

# 发送 bytes
sock.send(b"GET / HTTP/1.1\r\nHost: example.com\r\n\r\n")

# 接收数据并修改（bytearray）
data = bytearray(sock.recv(1024))
data[0] = 0x00  # 修改数据

7.3 加密/编码

import hashlib

# 计算哈希（输入需为 bytes）
hash_obj = hashlib.sha256(b"hello")
print(hash_obj.hexdigest())

8、注意事项

索引访问返回整数

b = b"abc"
print(b[0])  # 97（ASCII 'a'），不是 b"a"

不能直接存储非 ASCII 字符

# b"你好" ❌ 错误（需编码）
b_correct = "你好".encode("utf-8")  # ✅

bytearray 不能用作字典 key（因为可变）

Auto Copied

posted @ 2022-06-02 16:58 凡人半睁眼阅读(1084) 评论(0) 收藏举报

刷新页面返回顶部

海棠未雨，梨花先雪，一半春休

想看山海，早也去，晚也去，一个人也去

python3 数据类型

一、可变与不可类型

1、七大类数据类型

2、可变（mutable）和不可变（immutable）类型

二、数字类型

1、数字（Numeric）

2、Python3 中，bool 是 int 的子类

3、输出两位小数

三、字符串 string

1、字符串用单引号 ' 或双引号 " 括起来

2、内置方法：

四、列表 list

1、列表写在方括号 [ ] 之间、用逗号分隔开的元素列表。

2、list的内置方法

五、元组 tuple

1、元组是不可修改元素的列表。

六、字典 dictionary

1、字典是一种映射类型，字典用 { } 标识，它是一个键(key) : 值(value) 的集合。

2、字典解包 `{**dict1}`

3、字典的内置方法

七、集合 set

1、集合（set）是一个无序的不重复元素序列。

2、冻结集合（Frozen Set）不可变集合

3、集合的内置方法

八、字节和字节数组

1、字节 bytes 特点

2、字节创建方式

3、字节常用操作

4、字节数组 `bytearray特点`

5、字节数组创建方式

6、字节数组常用操作

7、应用场景

8、注意事项

公告

海棠未雨，梨花先雪，一半春休

想看山海，早也去，晚也去 ，一个人也去

python3 数据类型

一、可变与不可类型

1、七大类数据类型

2、可变（mutable） 和 不可变（immutable） 类型

二、数字类型

1、数字（Numeric）

2、Python3 中，bool 是 int 的子类

3、输出两位小数

三、字符串 string

1、字符串用单引号 ' 或双引号 " 括起来

2、内置方法：

四、列表 list

1、列表写在方括号 [ ] 之间、用逗号分隔开的元素列表。

2、list的内置方法

五、元组 tuple

1、元组是不可修改元素的列表。

六、字典 dictionary

1、字典是一种映射类型，字典用 { } 标识，它是一个键(key) : 值(value) 的集合。

2、字典解包 {**dict1}

3、字典的内置方法

七、集合 set

1、集合（set）是一个无序的不重复元素序列。

2、冻结集合（Frozen Set）不可变集合

3、集合的内置方法

八、字节和字节数组

1、字节 bytes 特点

2、字节创建方式

3、字节常用操作

4、字节数组 bytearray特点

5、字节数组创建方式

6、字节数组常用操作

7、应用场景

8、注意事项

公告

想看山海，早也去，晚也去，一个人也去

2、可变（mutable）和不可变（immutable）类型

2、字典解包 `{**dict1}`

4、字节数组 `bytearray特点`