collections模块
# collections模块 python中的扩展数据类型 # 在内置数据类型(dict、list、set、tuple)的基础上,collections模块还提供了几个额外的数据类型 # namedtuple 生成可以使用名字来访问元素内容的tuple # deque 双端队列,可以快速的从另外一侧追加和推出对象 # Counter 计数器,主要用来计数 # OrderedDict 有序字典 # defaultdict 带有默认值的字典 from collections import namedtuple # namedtuple 可命名元组的数据类型 Point = namedtuple('point', ['x', 'y']) p = Point(1, 2) print(p.x, p.y, p) # 1 2 point(x=1, y=2) # deque 双端队列 # 使用list存储数据时,按索引访问元素很快,但是插入和删除元素就很慢了,因为list是 # 线性存储,数据量大的时候,插入和删除效率很低 # deque是为了高效实现插入和删除操作的双向列表,适合用于队列和栈 from collections import deque q = deque(['a', 'b', 'c']) # 创建一个队列 q.append('x') # 从队尾插数据 q.appendleft('y') # 从队首插数据 print(q) # deque(['y', 'a', 'b', 'c', 'x']) q.pop() # 从队尾取的数据 q.popleft() # 从队首取数据 q.insert(1, '3') # 从索引1的位置插 # OrderedDict Key是有序的字典 # 使用dict时,key是无序的。在对dict做迭代时,我们无法确定key的顺序 # 如果要保持key的顺序,可以用OrdereDict from collections import OrderedDict d = dict([('a', 1), ('b', 2), ('c', 3)]) # ==> 这个dict的Key是无序的 print(d) # {'b': 2, 'c': 3, 'a': 1} od = OrderedDict([('a', 1), ('b', 2), ('c', 3)]) # ==> OrdereDict的Key是有序的 print(od) # OrderedDict([('a', 1), ('b', 2), ('c', 3)]) # defaultdict 带有默认值的字典 # 有如下值集合[11, 22, 33, 44, 55, 66, 77, 88, 99, 90] # 将所有大于66的值保存至字典的第一个key中,将小于66的值保存至第二个key的之中 # 即:{'k1' : 大于66的值, 'k2' : 小于66的值} # 使用dict时,如果引用的key不存在,就 会抛出KeyERrror,如果希望key不存在时,返回一个默认值 # 就可以用defaultdict. from collections import defaultdict l = [11, 22, 33, 44, 55, 66, 77, 88, 99, 90] print(l) my_dict = defaultdict(list) # 默认所有的value都是list,在字典中没有值时,所有的key默认都是空列表的值 for value in l: if value > 66: my_dict['k1'].append(value) else: my_dict['k2'].append(value) print(my_dict) # defaultdict(<class 'list'>, {'k1': [77, 88, 99, 90], 'k2': [11, 22, 33, 44, 55, 66]}) # Counter # counter类的目的是用来跟踪值出现的次数,它是一个无序的容器类型,以字典的键值对形式存储 # 其中元素作为key,其计数作为value,计数值可以是任意的Interger(包括0和复数)。 # Counter类和其他语言的bags或multisets很相似 from collections import Counter c = Counter('abcdefabcdabcdab') print(c) # Counter({'a': 4, 'b': 4, 'd': 3, 'c': 3, 'f': 1, 'e': 1}) # 补充 queue 队列 import queue q = queue.Queue() # 创建一个空队列 q.put(10) # 放进入了10 q.put(5) # 放进去了5 print(q.get()) # 10 #得到值,先进先出 print(q.get()) # 5 print(q.get()) # 当队列值中为空后,get会阻塞在这里,等待队列不为空