4.生成器和生成器表达式

一. 生成器

什么是生成器. 生成器实质就是迭代器. 在python中有三种方式来获取生成器:

1. 通过生成器函数

2. 通过各种推导式来实现生成器

3. 通过数据的转换也可以获取生成器
首先, 我们先看一个很简单的函数:

def func():
    print("111")
    return 222
ret = func()
print(ret)
# 111
# 222

将函数中的return换成yield就是生成器 

def func():
    print(111)
    yield 222

g = func()
print(g)
#<generator object func at 0x00000196D24A1CA8>

运行的结果和上面不一样. 为什么呢. 由于函数中存在了yield. 那么这个函数就是一个生成器函数. 这个时候. 我们再执行这个函数的时候. 就不再是函数的执行了. 而是获取这个生成器. 如何使用呢? 想想迭代器. 生成器的本质是迭代器. 所以. 我们可以直接执行__next__()来执行以下生成器.

def func():
    print("111")
    yield 222
    
gener = func()  # 这个时候函数不会执行.而是获取到生成器
ret = gener.__next__() #这个时候函数才会执行. yield的作用和return一样. 也是返回数据
print(ret)
# 结果
# 111
# 222

那么我们可以看到, yield和return的效果是⼀样的. 有什么区别呢?  yield是分段来执行一个函数. return呢? 直接停止执行函数.  

def func():
    print("111")
    yield 222
    print("333")
    yield 444

gener = func()
ret = gener.__next__()
print(ret)
ret2 = gener.__next__()
print(ret2)
ret3 = gener.__next__()
print(ret3)
结果
Traceback (most recent call last):
111
222
  File "D:/s18/生成器迭代器以及各种推导式/__init__.py", line 24, in <module>
333
444
    ret3 = gener.__next__()
StopIteration

当程序运行完后一个yield. 那么后面继续进行__next__()程序会报错.   

题目

老男孩向JACK JONES订 购10000套学生服. JACK JONES就比较实在. 直接造出来10000套衣服.

一方案 

def cloth():
    lst = []
    for i in range(0,10000):
        lst.append("衣服"+str(i))
    return lst
c1= cloth()
print(c1)

二方案

def cloth():
    for i in range(0,10000):
        yield "衣服"+ str(i)
c1 = cloth()
print(c1.__next__())
print(c1.__next__())
print(c1.__next__())
print(c1.__next__())

区别: 第一种是直接一次性全部拿出来. 会很占用内存. 第二种使用生成器. 一次就一个. 用多少生成多少.  生成器是一个的指向下一个. 不会回去, __next__()到哪, 指针就指到哪儿. 下一次继续获取指针指向的值.  

接下来我们来看send方法, send和__next__()一样都可以让生成器执行到下一个yield.  

def eat():
    print("我吃什么")
    a = yield "馒头"
    print("a", a)
    b = yield "大饼"
    print("b" , b)
    c = yield "菲菜合盒子"
    print("c",c)
    yield "GAME OVER"

gen = eat() #获取生成器
ret1 = gen.__next__()
print(ret1)
ret2 = gen.send("胡辣汤")
print(ret2)
ret3 = gen.send("狗粮")
print(ret3)
ret4 = gen.send("猫粮")
print(ret4)

send和__next__()区别:

1. send和next()都是让生成器向下走一次

2. send可以给上一个yield的位置传递值, 不能给后一个yield发送值. 在第一次执行生成器代码的时候不能使用send()

生成器可以使用for循环来循环获取内部的元素: 

def func():
    print(111)
    yield  222
    print(333)
    yield 444
    print(555)
    yield 666

gen = func()
for i in gen:
    print(i)
# 结果
# 111
# 222
# 333
# 444
# 555
# 666

二. 列表推导式, 生成器表达式以及其他推导式 

首先我们先看一下这样的代码, 给出一个列表, 通过循环, 向列表中添加1-14  :   

lst = []
for i in range(1,15):
    lst.append(i)
print(lst)

替换成列表推导式:  

lst = [i for i in range(1,15)]
print(lst)

列表推导式是通过一行来构建你要的列表, 列表推导式看起来代码简单. 但是出现错误之后很难排查. 列表推导式的常用写法:

 [ 结果 for 变量 in 可迭代对象]

例. 从python1期到python18期写入列表lst: 

lst = ["python%s期"%i for i in range(1,19)]
print(lst)

我们还可以对列表中的数据进行筛选  

筛选模式:

     [ 结果 for 变量 in 可迭代对象 if 条件 ] 

#获取1-100内所有的偶数
lst = [ i for i in range(1,101) if i % 2 == 0]
print(lst)

生成器表达式和列表推导式的语法基本上是一样的. 只是把[]替换成()   

gen = (i for i in range(10))
print(gen)
# 结果
# <generator object <genexpr> at 0x000002AC2E2F1CA8>

打印的结果就是一个生成器. 我们可以使用for循环来循环这个生成器: 

gen = ("桃宝我是第%s次爱你"%i for i in range(1,10))
for i in gen:
    print(i)

生成器表达式也可以进行筛选:

#获取1-100被3整除的数
gen = (i for i in range(1,101) if i % 3 == 0)
for num in gen:
    print(num)
    
#获取1-100被3整除的数的平方
gen = (i*i for i in range(1,101) if i % 3 == 0)
for num in gen:
    print(num)
    
#寻找名字中带有两个e的人的名字
names = [['Tom', 'Billy', 'Jefferson', 'Andrew', 'Wesley', 'Steven','Joe'],
        ['Alice', 'Jill', 'Ana', 'Wendy', 'Jennifer', 'Sherry', 'Eva']]
# 不用推导式
result = []
for first in names:
    for name in first:
        if name.count("e") == 2:
            result.append(name)
print(result)

#推导式
lst = [name1  for name in names for name1 in name if name1.count("e") == 2]
print(lst)

生成器表达式和列表推导式的区别:

1. 列表推导式比较耗内存. 一次性加载. 生成器表达式几乎不占用内存. 使用的时候才分配和使用内存

2. 得到的值不一样. 列表推导式得到的是一个列表. 生成器表达式获取的是一个生成器.

举个栗子.

同样⼀篮子鸡蛋. 列表推导式:直接拿到一篮子鸡蛋.  生成器表达式: 拿到⼀个老母鸡. 需要鸡蛋就给你下鸡蛋.

生成器的惰性机制: 生成器只有在访问的时候才取值. 说白了. 你找他要他才给你值. 不找他要. 他是不会执行的.

def func():
    print(111)
    yield 222

g = func() #生成器g
g1 = (i for i in g) #生成器g1 但是g1的数据来源于g
g2 = (i for i in g1)  #生成器g2,来源g1
print(list(g))#获取g中的数据,这时func()才会被执行 打印11,获得222,g完毕
print(list(g1))#获取g1中的数据,g1的数据来源于g,但数据g已经取完,g1也就没数据
print(list(g2)) #和g1 同理
# 答案
# 111
# [222]
# []
# []

深坑==> 生成器. 要值得时候才拿值.   

字典推导式:

    根据名字应该也能猜到. 推到出来的是字典   

#把字典中的key和value互换
dic = {"a":1,"b":"2"}
new_dic = {dic[key]:key for key in dic}
print(new_dic)
#在list中 从lst1中获取的数据和lst2中对应的数据组成一个新字典
lst1 = ['jay','jj','sylar']
lst2 = ['周杰伦','林俊杰','周彦涛']
dic = {lst1[i]:lst2[i] for i in range(len(lst1))}
print(dic)

集合推导式: 

   集合推导式可以帮我们直接生成一个集合.

集合的特点:

无序, 不重复. 所以集合推导式自带去重功能  

lst = [1,-1,8,-8,12]
s = {abs(i) for i in lst} #绝对值去重
print(s)

总结:

推导式有, 列表推导式, 字典推导式, 集合推导式, 没有元组推导式    生成器表达式: (结果 for 变量 in 可迭代对象 if 条件筛选)   

 生成器表达式可以直接获取到生成器对象. 生成器对象可以直接进行for循环. 生成器具有惰性机制.

面试题  

def add(a, b):
    return a + b
def test():
    for r_i in range(4):
        yield r_i
g = test()
for n in [2, 10]:
    g = (add(n, i) for i in g)
print(list(g))

友情提示:

惰性机制, 不到后不会拿值 这个题要先读一下. 然后自己分析出结果. 后用机器跑一下. 

答案[20,21,22,23]  

yiled from

def func():
    lst = ["衣服%s" % i for i in range(500)]
    yield from lst # 可以把一个可迭代对象分别进行yield返回

    lst1 = ["python%s" % i for i in range(18)]
    yield from lst1


gen = func()
print(gen.__next__())
print(gen.__next__())

只有先把lst执行完才会执行lst1的内容  

 1. 生成器
        本质就是迭代器.
        一个一个的创建对象
        创建生成器的方式:
            1. 生成器函数
            2. 通过生成器表达式来获取生成器
            3. 类型转换(看不到)
    2. 生成器函数 (重点)
        生成器函数中包含 yield , 返回数据和return差不多.
        return会立即结束这个函数的执行
        yield 可以分段的执行一个函数

        生成器函数在执行的时候返回生成器. 而不是直接执行此函数

        能向下执行的两个条件:
            __next__(), 执行到下一个yield
            send(), 执行到下一个yield, 给上一个yield位置传值

        所有的生成器都是迭代器都可以直接使用for循环
        都可以使用list()函数来获取到生成器内所有的数据

        生成器中记录的是代码而不是函数的运行
        def func():
            print("我的天哪 ")

            yield "宝宝"

        gen = func() # 创建生成器.  此时运行会把生成器函数中的代码记录在内存
        当执行到__next__(), 运行此空间中的代码, 运行到yield结束.

        优点: 节省内存, 生成器本身就是代码. 几乎不占用内存
        特点: 惰性机制, 只能向前. 不能反复

    3. 各种推导式 (诡异)
        列表推导式  [结果 for循环 if]
        字典推导式 {结果(k:v) for循环 if}
        集合推导式 {结果(k) for循环 if}



    4. 生成器表达式 (重点)
        (结果 for循环 if)
大概内容

 

  

posted @ 2019-02-24 14:29  等待の喵  阅读(344)  评论(0编辑  收藏  举报