迭代器

1. 迭代器介绍

迭代器即用来迭代取值的工具，而迭代是重复反馈过程的活动，其目的通常是为了逼近所需的目标或结果，每一次对过程的重复称为一次“迭代”，而每一次迭代得到的结果会作为下一次迭代的初始值,单纯的重复并不是迭代

# 单纯的循环不是迭代
while True:
    name = input()
    print(name)

# 重复且迭代（迭代取值）
l = ['umi', 'rem', 'ram']
i = 0
while i < len(l):
    print(l[i])
    i += 1

# 迭代器设计用来取值的工具，而涉及到把多个值循环取出来的类型
# 有：列表、字符串、元祖、字典、集合、文件

# 上述迭代取值的方式只适合用于有索引的数据类型（有序类型）：列表、字符串。元祖
# 为了解决索引迭代取值的局限性，python必须提供一种不依赖与索引的取值方式，这就是迭代器

通过索引的方式进行迭代取值，实现简单，但仅适用于序列类型：字符串，列表，元组。对于没有索引的字典、集合等非序列类型，必须找到一种不依赖索引来进行迭代取值的方式，这就用到了迭代器。

1.1 可迭代对象

想要了解迭代器为何物，必须事先搞清楚一个很重要的概念：可迭代对象（Iterable）。从语法形式上讲，内置有__iter__方法的对象都是可迭代对象，字符串、列表、元组、字典、集合、打开的文件都是可迭代对象：

sl = ''
sl.__iter__()
l = []
l.__iter__()
t = (1,)
t.__iter__()
d = {'a': 1}
d.__iter__()
set1 = (1, 2, 3)
set1.__iter__()
with open(r'a.txt', mode='r') as f:
    f.__iter__()

# 调用可迭代对象下的__iter__方法会将其转换成迭代器对象
d = {'a': 1, 'b': 2, 'c': 3}
d_iterator = d.__iter__()
# print(d_iterator)
'''
print(d_iterator.__next__())
print(d_iterator.__next__())
print(d_iterator.__next__())
print(d_iterator.__next__()) # 抛出异常StopIteration表示取值取干净了
'''

while True:
    try:
        print(d_iterator.__next__())
    except StopIteration:
        break
print('======》》》')  # 在一个迭代器取值取完的情况下，在对其取值取不到

d_iterator = d.__iter__()
while True:
    while True:
        try:
            print(d_iterator.__next__())
        except StopIteration:
            break

# 对有索引类型进行迭代取值
l = [1, 2, 3, 4, 5]
l_iterator = l.__iter__()

while True:
    try:
        print(l_iterator.__next__())
    except StopIteration:
        break

1.2 迭代器对象

调用obj.iter()方法返回的结果就是一个迭代器对象（Iterator）。迭代器对象是内置有iter和next方法的对象，打开文件的本身就是一个迭代器对象，执行迭代对象.iter()方法得到的仍然是迭代器本身，而执行迭代器.next()方法就会计算出迭代器中的下一个值。迭代器是python提供的一种统一的，不依赖与索引的迭代取值方式，只要存在多个‘值’，无论序列类型还是非序列类型都可以按照迭代器的方式取值

>>> s={1,2,3} # 可迭代对象s
>>> i=iter(s)  # 本质就是在调用s.__iter__(),返回s的迭代器对象i，
>>> next(i) # 本质就是在调用i.__next__()
1
>>> next(i)
2
>>> next(i)
3
>>> next(i)  #抛出StopIteration的异常，代表无值可取，迭代结束

1.3 可迭代对象与迭代器对象

1.3.1 可迭代对象（“可以转换成迭代器的对象”）：内置有__iter__方法的对象

# 可迭代对象.__iter__():得到迭代器对象

1.3.2 迭代器对象：内置有__next__方法并且内置有__iter__方法的对象

# 迭代器对象.__next__():得到迭代器的下一个值
# 迭代器对象.__iter__():得到迭代器本身，简单来说就是调了和没调一样
dic = {'a':1,'b':2,'c':3}

dec_iterator = dic.__iter__()
print(dec_iterator is dec_iterator.__iter__().__iter__().__iter__()) # True

# 可迭代对象：字符串、列表、元祖、字典、集合
# 迭代器对象：文件
'123'.__iter__()

[1,2,3].__iter__()

(1,2,3).__iter__()

{'a':1}.__iter__()

{1,2,3}.__iter__()

with open(r'a.txt',mode='w') as f:
    f.__iter__()
    f.__next__()

2. for循环原理

有了迭代器之后，可以不依赖索引迭代取值了，使用while循环的实现方式如下：

goods = ['mac', 'lenovo', 'acer', 'dell', 'sony']
i = iter(goods) # 每次都需要重新获取一个迭代器对象
while True:
    try:
        print(next(i))
    except StopIteration:
        break

for循环又称为迭代循环，in后可以跟任意可迭代对象，上述while循环可简写为：

goods=['mac','lenovo','acer','dell','sony']
for item in goods:   
    print(item)

for循环在工作时，首先会调用可迭代对象goods内置的iter方法拿到一个迭代器对象，然后再调用该迭代器对象的next方法将取到的值赋值给item，执行循环体完成一个循环，周而复始，直到捕捉StopIteration异常，结束迭代。

3. 迭代器的优缺点

基于索引的迭代取值，所有迭代的状态都保存在了索引中，而基于迭代器实现迭代的方式不再需要索引，所有迭代的状态就保存在迭代器中，然而这种方式优点与缺点并存：

3.1 优点

1. 为序列和非序列类型提供了一种统一的迭代取值的方式

2. 惰性计算：迭代器对象表示的是一个数据流，可以只在需要时才去调用next来计算出一个值，就迭代器本身来说，同一时刻在内存中只有一个值，因而可以存放无限大的数据流，而对于其他容器类型，如列表，需要把所有的元素都放在内存中，受内存大小的限制，可以放值的个数是有限的。

3.2 缺点

1. 除非取尽，否则无法获取迭代器的长度

2. 只能取下一个值，不能回到开始，更像是‘一次性的’，迭代器产生后的唯一目标就是重复执行next方法直到值取尽，否则就会停留在某一个位置，等待下一次调用next；若是要再次迭代同个对象，你只能重新调用iter方法去创建一个新的迭代器对象，如果有两个或多个循环使用同一个迭代器，必然只会有一个循环能取到值。

posted @ 2021-03-13 16:26 Avery_W 阅读(11) 评论(0) 收藏举报

刷新页面返回顶部

Avery

大道至简，知易行难

迭代器