python 容器 生成器 迭代器 总结

一、容器

容器是一种把多个元素组织在一起的数据结构,容器中的元素可以逐个地迭代获取,可以用in, not in关键字判断元素是否包含在容器中。通常这类数据结构把所有的元素存储在内存中。

1 >>> 4 in [3, 4]
2 True
3 >>> 4 in (3, 4)
4 True

二、可迭代对象Iterable和迭代器Iterator

我们在用for ... in ...语句循环时,in后面跟随的对象要求是可迭代对象,即可以直接作用于for循环的对象统称为可迭代对象(Iterable),如list、tuple、dict、set、str等。

可迭代对象是实现了__iter__()方法的对象,而迭代器(Iterator)则是实现了__iter__()和__next__()方法的对象,可以显示地获取下一个元素。这种可以被next调用并不断返回下一个值的对象称为迭代器。迭代器一定是可迭代对象,反过来则不一定成立。

__iter__返回迭代器自身,__next__返回容器中的下一个值。

iter()函数可以把一个可迭代对象转换成一个迭代器。

用iter()函数可以把list、dict、str等Iterable变成Iterator,例如:

1 i = iter([1, 2, 3])
2 print(i.__next__())
3 print(i.__next__())
4 print(i.__next__())
5 print(i.__next__())
1
2
3
Traceback (most recent call last):
  File "4.py", line 12, in <module>
    print(i.__next__())
StopIteration

判断一个对象是否是可迭代对象的方法:

1 >>> from collections import Iterable
2 >>> isinstance([1, 2, 3], Iterable)
3 True
4 >>> isinstance((1, 2, 3), Iterable)
5 True
6 >>> isinstance({'one': 1}, Iterable)
7 True
8 >>> isinstance('abc', Iterable)
9 True
10 >>> isinstance(b'abc', Iterable)
11 True
12 >>> isinstance(bytearray('abc', encoding='utf-8'), Iterable)
13 True

判断一个对象是否是迭代器:

1 1 >>> from collections import Iterator
2 2 >>> isinstance((x for x in range(10)), Iterator)
3 3 True
4 4 >>> isinstance([], Iterator)
5 5 False
6 6 >>> isinstance({}, Iterator)
7 7 False
8 8 >>> isinstance(b'abc', Iterator)
9 9 False

for..in..循环的运行实质:

更直观地感受迭代器内部的执行过程,我们自定义一个迭代器,以斐波那契数列为例:

 1 class Fib:
 2     def __init__(self):
 3         self.prev = 0
 4         self.curr = 1
 5  
 6     def __iter__(self):
 7         return self
 8  
 9     def __next__(self):
10         value = self.curr
11         self.curr += self.prev
12         self.prev = value
13         return value
14  
15 >>> f = Fib()
16 >>> list(islice(f, 0, 10))
17 [1, 1, 2, 3, 5, 8, 13, 21, 34, 55]

三、生成器

生成器(generator)就是一个能返回迭代器的函数,其实就是定义一个迭代算法,可以理解为一个特殊的迭代器。调用这个函数就得到一个迭代器,生成器中的yield相当于一个断点,执行到此返回一个值后暂停,从而实现next取值。

生成器算得上是Python语言中最吸引人的特性之一,生成器其实是一种特殊的迭代器,不过这种迭代器更加优雅。它不需要再像上面的类一样写__iter__()__next__()方法了,只需要一个yiled关键字。 生成器一定是迭代器(反之不成立),因此任何生成器也是以一种懒加载的模式生成值。用生成器来实现斐波那契数列的例子是:

1 def fib():
2     prev, curr = 0, 1
3     while True:
4         yield curr
5         prev, curr = curr, curr + prev
6  
7 >>> f = fib()
8 >>> list(islice(f, 0, 10))
9 [1, 1, 2, 3, 5, 8, 13, 21, 34, 55]

fib就是一个普通的python函数,它特殊的地方在于函数体中没有return关键字,函数的返回值是一个生成器对象。当执行f=fib()返回的是一个生成器对象,此时函数体中的代码并不会执行,只有显示或隐示地调用next的时候才会真正执行里面的代码。

生成器在Python中是一个非常强大的编程结构,可以用更少地中间变量写流式代码,此外,相比其它容器对象它更能节省内存和CPU,当然它可以用更少的代码来实现相似的功能。

1 def something():
2     result = []
3     for ... in ...:
4         result.append(x)
5     return result

都可以用生成器函数来替换:

def something():
    result = []
    for ... in ...:
        result.append(x)
    return result

现在就可以动手重构你的代码了,但凡看到类似:

1 def iter_something():
2     for ... in ...:
3         yield x

四、生成表达式

生成器表达式(generator expression)是列表推倒式的生成器版本,看起来像列表推导式,但是它返回的是一个生成器对象而不是列表对象。

1 >>> a = (x*x for x in range(10))
2 >>> a
3 <generator object <genexpr> at 0x401f08>
4 >>> sum(a)
5 285

 

posted @ 2017-12-22 11:18  魂~  阅读(287)  评论(0编辑  收藏  举报