# collections模块 python中的扩展数据类型
# 在内置数据类型(dict、list、set、tuple)的基础上,collections模块还提供了几个额外的数据类型
# namedtuple 生成可以使用名字来访问元素内容的tuple
# deque 双端队列,可以快速的从另外一侧追加和推出对象
# Counter 计数器,主要用来计数
# OrderedDict 有序字典
# defaultdict 带有默认值的字典
from collections import namedtuple
# namedtuple 可命名元组的数据类型
Point = namedtuple('point', ['x', 'y'])
p = Point(1, 2)
print(p.x, p.y, p) # 1 2 point(x=1, y=2)
# deque 双端队列
# 使用list存储数据时,按索引访问元素很快,但是插入和删除元素就很慢了,因为list是
# 线性存储,数据量大的时候,插入和删除效率很低
# deque是为了高效实现插入和删除操作的双向列表,适合用于队列和栈
from collections import deque
q = deque(['a', 'b', 'c']) # 创建一个队列
q.append('x') # 从队尾插数据
q.appendleft('y') # 从队首插数据
print(q) # deque(['y', 'a', 'b', 'c', 'x'])
q.pop() # 从队尾取的数据
q.popleft() # 从队首取数据
q.insert(1, '3') # 从索引1的位置插
# OrderedDict Key是有序的字典
# 使用dict时,key是无序的。在对dict做迭代时,我们无法确定key的顺序
# 如果要保持key的顺序,可以用OrdereDict
from collections import OrderedDict
d = dict([('a', 1), ('b', 2), ('c', 3)]) # ==> 这个dict的Key是无序的
print(d) # {'b': 2, 'c': 3, 'a': 1}
od = OrderedDict([('a', 1), ('b', 2), ('c', 3)]) # ==> OrdereDict的Key是有序的
print(od) # OrderedDict([('a', 1), ('b', 2), ('c', 3)])
# defaultdict 带有默认值的字典
# 有如下值集合[11, 22, 33, 44, 55, 66, 77, 88, 99, 90]
# 将所有大于66的值保存至字典的第一个key中,将小于66的值保存至第二个key的之中
# 即:{'k1' : 大于66的值, 'k2' : 小于66的值}
# 使用dict时,如果引用的key不存在,就 会抛出KeyERrror,如果希望key不存在时,返回一个默认值
# 就可以用defaultdict.
from collections import defaultdict
l = [11, 22, 33, 44, 55, 66, 77, 88, 99, 90]
print(l)
my_dict = defaultdict(list) # 默认所有的value都是list,在字典中没有值时,所有的key默认都是空列表的值
for value in l:
if value > 66:
my_dict['k1'].append(value)
else:
my_dict['k2'].append(value)
print(my_dict) # defaultdict(<class 'list'>, {'k1': [77, 88, 99, 90], 'k2': [11, 22, 33, 44, 55, 66]})
# Counter
# counter类的目的是用来跟踪值出现的次数,它是一个无序的容器类型,以字典的键值对形式存储
# 其中元素作为key,其计数作为value,计数值可以是任意的Interger(包括0和复数)。
# Counter类和其他语言的bags或multisets很相似
from collections import Counter
c = Counter('abcdefabcdabcdab')
print(c) # Counter({'a': 4, 'b': 4, 'd': 3, 'c': 3, 'f': 1, 'e': 1})
# 补充 queue 队列
import queue
q = queue.Queue() # 创建一个空队列
q.put(10) # 放进入了10
q.put(5) # 放进去了5
print(q.get()) # 10 #得到值,先进先出
print(q.get()) # 5
print(q.get()) # 当队列值中为空后,get会阻塞在这里,等待队列不为空