什么是生成器:
可以理解为一种数据类型,这种数据类型自动实现了迭代器协议(其他的数据类型需要调用自己内置的_iter_()方法),所以生成器就是可迭代对象。
生成器分类及在Python中的表现形式:(Python有两种不同的方式提供生成器)
1、生成器函数:常规函数定义,但是使用yield语句而不是return语句返回结果。yield语句一次返回一个结果,在每个结果中间,挂起函数的状态,以便下次从它离开的地方继续执行
2、生成器表达式:类似于列表推导,但是,生成器返回按需产生结果的一个对象,而不是一次构建一个结果列表。
生成器的优点:
Python使用生成器对延迟操作提供了支持。所谓延迟操作,是指在需要的时候才产生结果,而不是立即产生结果。这也是生成器的主要优点。
生成器小结:
1、是可迭代对象
2、实现了延迟计算、节省内存
3、生成器和其他的数据类型一样,都是实现了迭代器协议,只不过生成器附加了一个延迟计算省内存的好处,其余的可迭代对象没有这点好处。
知识储备——三元表达式和列表解析
#三元表达式 city = '北京' print('large' if city == 'shanghai' else 'small') #等同于下面的代码 if city == 'shanghai': print('large') else: print('small') #列表解析 city_list = [] for i in range(10): city_list.append('城市%s'%i) print(city_list) #等同于下面的列表解析代码,结果是直接放在内存中,数据量很大的时候,这种方式不可取 city_list1 = ['城市%s'%i for i in range(10)] #利用三元表达式生成5个城市 city_list2 = ['城市%s'%i for i in range(10) if i>4] print(city_list1) print(city_list2)
生成器之函数表示:
def fun1(): yield 1 yield 2 yield 3 res =fun1() print(res) print(res.__next__()) print(res.__next__()) print(res.__next__()) 返回结果 <generator object fun1 at 0x00000000006D0150> 1 2 3 Process finished with exit code 0
生成器表达式:
#使用生成器表达式 city_list = ('城市%s'%i for i in range(10)) print(city_list) print(city_list.__next__()) print(city_list.__next__()) print(city_list.__next__()) print(city_list.__next__()) 执行结果 <generator object <genexpr> at 0x0000000000A30150> 城市0 城市1 城市2 城市3 Process finished with exit code 0
生成器总结
综上已经对生成器有了一定的认识,下面我们以生成器函数为例进行总结
- 语法上和函数类似:生成器函数和常规函数几乎是一样的。它们都是使用def语句进行定义,差别在于,生成器使用yield语句返回一个值,而常规函数使用return语句返回一个值
- 自动实现迭代器协议:对于生成器,Python会自动实现迭代器协议,以便应用到迭代背景中(如for循环,sum函数)。由于生成器自动实现了迭代器协议,所以,我们可以调用它的next方法,并且,在没有值可以返回的时候,生成器自动产生StopIteration异常
- 状态挂起:生成器使用yield语句返回一个值。yield语句挂起该生成器函数的状态,保留足够的信息,以便之后从它离开的地方继续执行
优点一:生成器的好处是延迟计算,一次返回一个结果。也就是说,它不会一次生成所有的结果,这对于大数据量处理,将会非常有用。
1 #列表解析
2 sum([i for i in range(100000000)])#内存占用大,机器容易卡死
3
4 #生成器表达式
5 sum(i for i in range(100000000))#几乎不占内存
优点二:生成器还能有效提高代码可读性
#求一段文字中,每个单词出现的位置 def index_words(text): result = [] if text: result.append(0) for index,letter in enumerate(text,1): if letter == ' ': result.append(index) return result #for index,letter in enumerate(text1): # print('index=%s letter=%s'%(index,letter)) print(index_words('hello world Akuma'))
运行结果:
"C:\Program Files\Anaconda3\python.exe" "E:/study python/Day3/三元表达式和列表解析.py"
[0, 6, 12]
Process finished with exit code 0
注意事项:生成器只能遍历一次!