1-4-07 数据类型-集合(set)

集合(set)

1. 定义

set集合,一个不允许重复重复 & 可变类型(元素可哈希)。

集合是一个 无序 、可变、不允许数据重复的容器。

v1 = { 11, 22, 33, "alex" }
  • 无序,无法通过索引取值。
  • 可变,可以添加和删除元素。
  • 不允许数据重复。

一般什么时候用集合呢?

就是想要维护一大堆不重复的数据时,就可以用它。比如:做爬虫去网上找图片的链接,为了避免链接重复,可以选择用集合去存储链接地址。

注意:定义空集合时,只能使用v = set(),不能使用v={}(这样是定义一个空字典)。


2. 独有功能

1. 添加元素

data.add("郑裕玲")

2. 删除元素

data.discard("关之琳") 

3. 交集

s1 = {"刘能", "赵四", "⽪⻓⼭"}
s2 = {"刘科⻓", "冯乡⻓", "⽪⻓⼭"}

s4 = s1.intersection(s2) # 取两个集合的交集 
print(s4) # {"⽪⻓⼭"}

s3 = s1 & s2   			  # 取两个集合的交集

4. 并集

s1 = {"刘能", "赵四", "⽪⻓⼭"}
s2 = {"刘科⻓", "冯乡⻓", "⽪⻓⼭"}
s4 = s1.union(s2) 		
# 取两个集合的并集  {"刘能", "赵四", "⽪⻓⼭","刘科⻓", "冯乡⻓", }

s3 = s1 | s2   			# 取两个集合的并集

5. 差集

s4 = s1.difference(s2) 		# 差集,s1中有且s2中没有的值 {"刘能", "赵四"}
s6 = s2.difference(s1)   	# 差集,s2中有且s1中没有的值 {"刘科⻓", "冯乡⻓"}

s3 = s1 - s2   			   # 差集,s1中有且s2中没有的值
s5 = s2 - s1   			   # 差集,s2中有且s1中没有的值3.

3. 公共功能

1. 减,计算差集

s3 = s1 - s2 

2. &,计算交集

s3 = s1 & s2

3. |,计算并集

s3 = s1 | s2

4. 长度

data = len(v)

5. for循环

v = {"刘能", "赵四", "尼古拉斯"}
for item in v:
	print(item)

4. 转换

其他类型如果想要转换为集合类型,可以通过set进行转换,并且如果数据有重复自动剔除。

提示:int/list/tuple/dict都可以转换为集合。

v2 = set(v1)

提示:这其实也是去重的一个手段。

data = {11,22,33,3,99}
v1 = list(data) # [11,22,33,3,99]
v2 = tuple(data) # (11,22,33,3,99)

5. 其他

5.1 集合的存储原理

image

5.2 元素必须可哈希

因存储原理,集合的元素必须是可哈希的值,即:内部通过通过哈希函数把值转换成一个数字。
image

目前可哈希的数据类型:int、bool、str、tuple,而list、set是不可哈希的。

总结:集合的元素只能是 int、bool、str、tuple 。

v2 = set(v1) # 成功
v2 = set(v1) # 报错 

5.3 查找速度特别快

因存储原理特殊,集合的查找效率非常高(数据量大了才明显)。

user_set = {"武沛齐","alex","李璐"}
if "alex" in user_set:
    print("在")
else:
    print("不在")

5.4 对比和嵌套

类型 是否可变 是否有序 元素要求 是否可哈希 转换 定义空
list list(其他) v=[]或v=list()
tuple tuple(其他) v=()或v=tuple()
set 可哈希 set(其他) v=set()

注意:由于True和False本质上存储的是 1 和 0 ,而集合又不允许重复,所以在整数 0、1和False、True出现在集合中会有如下现象:

v1 = {True, 1}
print(v1)  # {True}

v2 = {1, True}
print(v2)  # {1}

v3 = {0, False}
print(v3)  # {0}

v4 = {False, 0}
print(v4)  # {False}
posted @ 2022-10-19 09:19  布丁家的苏苏  Views(33)  Comments(0)    收藏  举报