yield 生成器的原理
以下转载自:https://blog.csdn.net/mieleizhi0522/article/details/82142856/
和https://developer.ibm.com/zh/articles/os-cn-python-yield/
1,生成器的作用
如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器:generator。
下面举例子说明:
打印斐波那契数列
def foo(5):
n,a,b=0,0,1
while n<5:
print(b)
a,b=b,a+b
n += 1
foo(5)
打印完数据后,后续不能使用,因此保存到列表内:
def foo(5)
l = []
n,a,b=0,0,1
while n < 5:
l.append(b)
a,b=b,a+b
n=n+1
这样数组可以后续使用,但是每增加一个数都会延长数组长度, 占用很多内存。
3.
使用迭代器:
class Foo(object):
def __init__(self,max):
self.max = max
self.n,self.a,self.b=0,0,1
def foo(self):
if self.n<self.max:
r = self.b
self.a,self.b=self.b,self.a+self.b
self.n += 1
return r
raise StopIteration()
这样可以在你想要停止的地方停止函数,然后输出想要的数据,每次都只是返回一个数据,避免了内存的限制问题。但是这样写很复杂,因此使用yeild函数:
def foo(5):
n,a,b=0,0,1
while n<max:
yeild b
a,b=b,a+b
n=n+1
结论:一个带有 yield 的函数就是一个 generator,它和普通函数不同,生成一个 generator 看起来像函数调用,但不会执行任何函数代码,直到对其调用 next()(在 for 循环中会自动调用 next())才开始执行。虽然执行流程仍按函数的流程执行,但每执行到一个 yield 语句就会中断,并返回一个迭代值,下次执行时从 yield 的下一个语句继续执行。看起来就好像一个函数在正常执行的过程中被 yield 中断了数次,每次中断都会通过 yield 返回当前的迭代值。
yield 的好处是显而易见的,把一个函数改写为一个 generator 就获得了迭代能力,比起用类的实例保存状态来计算下一个 next() 的值,不仅代码简洁,而且执行流程异常清晰。
2,如何判断是否是生成器?
如何判断一个函数是否是一个特殊的 generator 函数?可以利用 isgeneratorfunction 判断:
from inspect import isgeneratorfunction
>>> isgeneratorfunction(fab)
>>> True
上面的例子foo()函数本身不是生成器,foo(5)才是。foo 是一个 generator function,而 foo(5) 是调用 foo 返回的一个 generator,好比类的定义和类的实例的区别:
import types
>>> isinstance(foo,types.GeneratorType)
>>> False
>>> isinstance(foo(5),types.GeneratorType)
>>> True
3,yield和return的关系和区别
带yield的函数是一个生成器,而不是一个函数了,这个生成器有一个函数就是next函数,next就相当于“下一步”生成哪个数,这一次的next开始的地方是接着上一次的next停止的地方执行的,所以调用next的时候,生成器并不会从foo函数的开始执行,只是接着上一步停止的地方开始,然后遇到yield后,return出要生成的数,此步就结束
def foo():
print("starting...")
while True:
res = yield 4
print("res:",res)
g = foo()
print(next(g))
print("*"*20)
print(g.send(7))
输出:
starting...
4
********************
res: 7
4
程序执行g.send(7),程序会从yield关键字那一行继续向下运行,send会把7这个值赋值给res变量
由于send方法中包含next()方法,所以程序会继续向下运行执行print方法,然后再次进入while循环
程序执行再次遇到yield关键字,yield会返回后面的值后,程序再次暂停,直到再次调用next方法或send方法。
4,文件读取
如果使用read()方法,读取一个很大的文件,很占用内存。
使用yeild可以分片取出,利用固定长度的缓冲区来不断读取文件内容。
def read_file():
block_size = 1024
with open(fpath,'rb') as f:
while True:
block = f.read(block_size)
if block:
yeild block
else:
return

浙公网安备 33010602011771号