yield 生成器的原理

以下转载自:https://blog.csdn.net/mieleizhi0522/article/details/82142856/
https://developer.ibm.com/zh/articles/os-cn-python-yield/

1,生成器的作用

如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器:generator。


下面举例子说明:

打印斐波那契数列

def foo(5):
    n,a,b=0,0,1
    while n<5:
        print(b)
        a,b=b,a+b
        n += 1
foo(5)
    

打印完数据后,后续不能使用,因此保存到列表内:

def foo(5)
l = []
n,a,b=0,0,1
while n < 5:
    l.append(b)
    a,b=b,a+b
    n=n+1

这样数组可以后续使用,但是每增加一个数都会延长数组长度, 占用很多内存。
3.
使用迭代器:

class Foo(object):
    def __init__(self,max):
        self.max = max
        self.n,self.a,self.b=0,0,1
    def foo(self):
        if self.n<self.max:
            r = self.b
            self.a,self.b=self.b,self.a+self.b
            self.n += 1
            return r
        raise StopIteration()

这样可以在你想要停止的地方停止函数,然后输出想要的数据,每次都只是返回一个数据,避免了内存的限制问题。但是这样写很复杂,因此使用yeild函数:

def foo(5):
    n,a,b=0,0,1
    while n<max:
        yeild b
        a,b=b,a+b
        n=n+1

结论:一个带有 yield 的函数就是一个 generator,它和普通函数不同,生成一个 generator 看起来像函数调用,但不会执行任何函数代码,直到对其调用 next()(在 for 循环中会自动调用 next())才开始执行。虽然执行流程仍按函数的流程执行,但每执行到一个 yield 语句就会中断,并返回一个迭代值,下次执行时从 yield 的下一个语句继续执行。看起来就好像一个函数在正常执行的过程中被 yield 中断了数次,每次中断都会通过 yield 返回当前的迭代值。

yield 的好处是显而易见的,把一个函数改写为一个 generator 就获得了迭代能力,比起用类的实例保存状态来计算下一个 next() 的值,不仅代码简洁,而且执行流程异常清晰。

2,如何判断是否是生成器?

如何判断一个函数是否是一个特殊的 generator 函数?可以利用 isgeneratorfunction 判断:

from inspect import isgeneratorfunction
>>> isgeneratorfunction(fab)
>>> True

上面的例子foo()函数本身不是生成器,foo(5)才是。foo 是一个 generator function,而 foo(5) 是调用 foo 返回的一个 generator,好比类的定义和类的实例的区别:

import types
>>> isinstance(foo,types.GeneratorType)
>>> False
>>> isinstance(foo(5),types.GeneratorType)
>>> True

3,yield和return的关系和区别

带yield的函数是一个生成器,而不是一个函数了,这个生成器有一个函数就是next函数,next就相当于“下一步”生成哪个数,这一次的next开始的地方是接着上一次的next停止的地方执行的,所以调用next的时候,生成器并不会从foo函数的开始执行,只是接着上一步停止的地方开始,然后遇到yield后,return出要生成的数,此步就结束

def foo():
    print("starting...")
    while True:
        res = yield 4
        print("res:",res)
g = foo()
print(next(g))
print("*"*20)
print(g.send(7))

输出:

starting...
4
********************
res: 7
4

程序执行g.send(7),程序会从yield关键字那一行继续向下运行,send会把7这个值赋值给res变量

由于send方法中包含next()方法,所以程序会继续向下运行执行print方法,然后再次进入while循环

程序执行再次遇到yield关键字,yield会返回后面的值后,程序再次暂停,直到再次调用next方法或send方法。

4,文件读取

如果使用read()方法,读取一个很大的文件,很占用内存。
使用yeild可以分片取出,利用固定长度的缓冲区来不断读取文件内容。

def read_file():
    block_size = 1024
    with open(fpath,'rb') as f:
        while True:
            block = f.read(block_size)
            if block:
                yeild block
            else:
                return
posted @ 2021-03-10 23:22  狂想曲°  阅读(78)  评论(0)    收藏  举报