Python 学习 第六篇:迭代和解析

Python中的迭代是指按照元素的顺序逐个调用的过程,迭代概念包括:迭代协议、可迭代对象和迭代器三个概念。

迭代协议是指有__next__()函数的对象会前进到下一个结果,而到达系列的末尾时,则会引发StopIteration异常。为了支持迭代协议,Python内置了两个函数:iter()和next()函数。iter()从可迭代对象中获得一个迭代器,迭代器含有next()函数。next()函数的作用就是调用对象的__next__()函数,从而递进进到下一项。

在Python中,任何支持迭代协议的对象都是可迭代的。如果对象是序列类型,或者在迭代工具中一次产生一个结果,那么就是可迭代的,这就以为着,序列(字符串、元组和列表)是可迭代对象。

迭代器是Python中实现迭代协议的对象,具体指的是iter()返回的,支持next()函数的对象。

Python中的迭代工具会自动调用iter()和next()函数以实现迭代,迭代工具主要有:for循环、列表解析、in成员关系测试以及map内置函数等。

一,手动迭代

列表不是自身的迭代器,对于这样的可迭代对象,可以调用iter()函数来启动迭代,调用next()函数递进到下一项:

>>> a=list(range(0,5))
>>> a is iter(a)
False
>>> a=iter(a)
>>> next(a)
0

像for循环等迭代工具,会自动调用iter()和next()函数,以实现序列的自动迭代:

>>> for i in range(0,5): print(i,end=' ')
0 1 2 3 4 

二,生成器

生产器是一个延迟产生结果的工具,在需要的时候才产生结果,而不是立即产生结果。

1,生成器函数

Python提供了yield语句以实现生成器函数,以实现在需要的时候才产生结果,而不是立即产生结果。Python的生产器函数是指:编写为常规的def语句,但是使用yield语句,一次返回一个结果,在每个结果之间挂起和继续的状态。 

生产器函数自动实现迭代协议,每次调用只返回一个值,下次调用时,会从其退出的地方继续执行。

生产器函数和常规函数的不同之处在于:生产器yield一个值,而不是return一个值。yield语句挂起该函数,并向调用者发送一个值,但是,保留足够的状态以使得函数能够从它离开的地方继续执行。当继续时,函数在上一个yield返回后继续执行。这使得生产器函数每次调用只返回一个值,穷尽调用会产生一系列的值。

>>> def seq_int(n):
    for i in range(n):
        yield i**2
    
>>> for i in seq_int(5):
    print(i,end =' ')
  
0 1 4 9 16 

生产器函数返回的对象就是迭代器,可以使用next()前进到下一项:

>>> func=seq_int(5)
>>> iter(func) is func
True
>>> next(func)
0

2,生产器表达式

另外一个实现生产器的对象是生产器表达式,从语法上讲,生成器表达式是在小括号中的表达式。从执行过程来讲,生产器表达式不在内存中构建结果,而是返回一个生成器对象,这个对象支持迭代协议。

>>> a=(x**2 for x in range(0,5))
>>> a is iter(a)
True

三,解析

解析分为列表解析,集合解析和字典解析。

  • 列表解析的格式是:[ f(x) for x in seq  ],对应的生成器表达式是:list( f(x) for x in seq )
  • 集合解析的格式是:{ f(x) for x in seq  },对应的生成器表达式是:set(f(x) for x in seq )
  • 字典解析的格式是:{key:value for (key, value) in zip(keys,values)},对应的生成器表达式是:dict((x,f(x))  for x in items  )

从语法上讲,列表解析是在中括号中的表达式;从执行过程来讲,列表解析对序列中的每一个元素执行一个操作;从执行的结果来讲,列表解析产生的一个新的列表对象。

由于列表解析产生的结果是一个列表对象,包含所有的序列项,不属于延迟产生结果的工具。

>>> a=[x**2 for x in range(0,5)]
>>> isinstance(a,list)
True

解析表达式支持嵌套:

[m+'_'+n for m in ['a', 'b'] for n in ['c', 'd']]
#['a_c', 'a_d', 'b_c', 'b_d']

解析表达式支持条件查询:

L = [1, 2, 3, 4, 5, 6, 7]
[i if i <= 5 else 5 for i in L]
#[1, 2, 3, 4, 5, 5, 5]

四,内置的迭代器函数

这一节,总结Python 3.0中内置的迭代器函数,除了range()函数之外,其余的函数都会产生迭代器对象,延迟产生结果。

1,range 迭代对象

range返回一个可迭代对象,该迭代对象根据需要产生范围中的数字,而不是在内存中构建一个列表。如果需要一个范围列表的话,必须使用list( range(...))来强制返回一个列表。

>>> r = range(0,5)
>>> iter(r) is r
False
>>> list(r)
[0, 1, 2, 3, 4]
>>> r=iter(r)
>>> next(r)
0

2,zip实现并行遍历

zip()函数用于合并序列,按照序列中元素的位置,把序列的元素组合成元组,元组项的数量就是zip合并的序列的个数。当序列的长度不同时,zip会以最短序列的长度为准来截断所得到的元组。

zip函数能够把多个可迭代对象打包成一个元组构成的可迭代对象,它返回了一个zip对象,通过tuplelist可以得到相应的打包结果:

L1, L2, L3 = list('abc'), list('def'), list('hij')
list(zip(L1, L2, L3))
#[('a', 'd', 'h'), ('b', 'e', 'i'), ('c', 'f', 'j')]

tuple(zip(L1, L2, L3))
#(('a', 'd', 'h'), ('b', 'e', 'i'), ('c', 'f', 'j'))

通常在循环迭代的时候会使用zip函数:

for i, j, k in zip(L1, L2, L3):
     print(i, j, k)

当需要对两个列表建立字典映射时,可以利用zip对象:

dict(zip(L1, L2))
#{'a': 'd', 'b': 'e', 'c': 'f'}

既然有了压缩函数,那么Python也提供了*操作符和zip联合使用来进行解压操作:

zipped = list(zip(L1, L2, L3))
# [('a', 'd', 'h'), ('b', 'e', 'i'), ('c', 'f', 'j')]

# 三个元组分别对应原来的列表
list(zip(*zipped)) 

例如,zip把序列a和b合并为一个序列c,c的元素的元组(0,5),(1,6),(2,7),(3,8),(4,9)。

>>> a = range(0,5)
>>> b = range(5,10)
>>> c = zip(a,b)
>>> iter(c) is c
True
>>> next(c)
(0, 5)
>>> list(c)
[(1, 6), (2, 7), (3, 8), (4, 9)]

3,map对序列应用函数

map()函数对一个序列的各个元素应用函数,返回函数调用的结果序列。

>>> m=map(ord,'abcd')
>>> iter(m) is m
True
>>> list(m)
[97, 98, 99, 100]

4,产生偏移和元素

enumerate也是一个打包函数,在迭代时绑定迭代元素的序号,过程是:作用于每一个序列项,获取每一个序列项偏移,并把偏移和序列项组合成元组(index, item)返回。原始序列的每个元素及其索引都能得到。

L = list('abcd')
for index, value in enumerate(L):
     print(index, value)

0 a
1 b
2 c
3 d

用zip对象也能实现这个功能:

for index, value in zip(range(len(L)), L):
     print(index, value)

enumerate()函数返回一个迭代器对象,使用next()方法会返回下一个元素:

>>> t=enumerate('abcd')
>>> iter(t) is t
True
>>> list(t)
[(0, 'a'), (1, 'b'), (2, 'c'), (3, 'd')]

在for循环结构中,每次迭代,for循环都会自动调用next()函数以返回下一个元组(index,item):

>>> [c * i for (i,c) in enumerate('abcd')]
['', 'b', 'cc', 'ddd']

5,filter迭代器

filter()函数对一个序列的各个元素应用函数,返回结果为True的元素。

>>> f=filter(bool, ['a','','b',None])
>>> iter(f) is f
True
>>> list(f)
['a', 'b']

6,reduce() 函数

注意:reduce()函数并不是一个迭代器,它是functools模块中的一个工具函数。

reduce()用于对序列的元素依次应用函数,并把函数调用的结果作为参数传递给函数,最终返回函数调用的结果。

>>> from functools import reduce
>>> reduce((lambda x,y:x+y),range(0,5))
10

reduce()函数执行流程等价于下面的代码块:

x=list(range(0,5)]
res=x[0]
for i in x[1:] :
    res+=i

 

 

 

 

 

 

参考文档:

作者悦光阴
本文版权归作者和博客园所有,欢迎转载,但未经作者同意,必须保留此段声明,且在文章页面醒目位置显示原文连接,否则保留追究法律责任的权利。
posted @ 2018-12-17 10:44  悦光阴  阅读(1334)  评论(2编辑  收藏  举报