在了解这个内容之前我们需要先了解一下列表生成式
列表生成式
通过列表生成式,我们可以直接创建一个列表。
L =[i*2 for i in range(5)]
print(L)
# 运行结果:[0, 2, 4, 6, 8]
但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,占用的存储空间也很大,如果我们大多是时候只要访问前面几个元素,偶尔访问后面的元素,那对于性能并不是很友好。
生成器(Generator)
所以,如果列表元素可以按照某种规则推算出来,那么我们不必创建一个完整的list。在Python中,这种一边循环一边计算的机制,称之为生成器
要创建一个generator,有很多种方法。第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个generator:
g = (x * x for x in range(10))
print(g)
# 运行结果:
# <generator object <genexpr> at 0x00000049733883B8>
# generator有next()获取元素值,但基本上永远不会调用next()方法,而是通过for循环来迭代它。
for i in g :
# 注释
print(i)
# 运行结果:
# 0
# 1
# 3
# 9
# ...
个人理解列表生成器会在编译的时候就生成好完整的数据,而生成器编译的时候只会返回一个内存地址,我们调用的时候才会生成相应的数据
通过上面的例子可能会让我们以为生成器是一个表达式,其实python其提供了两种表达方式
- 生成器表达式:返回一个对象,这个对象只有在需要的时候才产生结果
- 生成器函数:也是用def定义的,利用关键字yield一次性返回一个结果,阻塞,重新开始
生成器函数普通函数的区别在于,一般的函数在执行完毕之后会返回一个值然后退出,但是生成器函数会自动挂起,然后重新拾起继续执行,他会利用yield关键字关起函数,给调用者返回一个值,同时保留了当前的足够多的状态,可以使函数继续执行
# 函数有了yield之后,函数名+()就变成了生成器
# return在生成器中代表生成器的中止,直接报错
def consumer(name):
print('%s,准备吃包子了' % name)
while True:
baozi = yield
print("%s馅儿的" % baozi)
c = consumer('Victor') # 创建生成器,返回 对象地址
c.__next__() # next 第一次调用会在 yield 前面停止
# 运行结果:Victor,准备吃包子了
c.send('韭菜') # send 作用是唤醒并继续执行,同时传一个值到生成器内部 yield 接收
# 运行结果:韭菜馅儿的
c.__next__() # next 作用是唤醒并继续执行
# 运行结果:None馅儿的
迭代器
可以直接作用于for 循环的对象统称为可迭代对象:Iterable;我们已经知道,可以直接作用于for循环的数据类型有以下几种:
- 一类是集合数据类型,如list,tuple,dict,set,str等
- 一类是generator,包括生成器和带yield的generator function
可以使用isinstance()判断一个对象是否为可Iterable对象,如下:
from collections import Iterable
# 判断是否可迭代
print(isinstance([], Iterable)) # Iterable 可迭代的
# 结果:True
print(isinstance((x for x in range(10)), Iterable))
# 结果:True
print(isinstance(100, Iterable))
# 结果:False
可以被next()函数调用并不断返回下一个值的迭代对象称为迭代器:Iterator。
生成器都是Iterator对象(迭代器),但list、dict、str虽然是Iterable(可迭代对象),却不是Iterator(迭代器)。
- 把list、dict、str等Iterable变成Iterator可以使用iter()函数:
from collections import Iterable
from collections import Iterator
# 判断是为迭代器
print(isinstance(iter([]), Iterator))
# 结果:True
print(isinstance(iter('abc'), Iterator))
# 结果:True
小结:
- 凡是可作用于for循环的对象都是Iterable【可迭代】类型;
- 凡是可作用于next()函数的对象都是Iterator【迭代器】类型,它们表示一个惰性计算的序列;
- 集合数据类型如list、dict、str等是Iterable但不是Iterator,不过可以通过iter()函数获得一个Iterator对象。
更多内容参考
网友评论