我暂时是参考《Python进阶》中文版,不懂的地方日后查看手册补充。
生成器(Generators)
要理解生成器我们首先就要理解什么是迭代器(iterators)。
根据维基百科,迭代器是一个让程序员可以遍历一个容器(如列表)的对象。
然而,一个迭代器在遍历并读取一个容器的数据元素时,并不会执行一个迭代。你可能有点晕了,那我们来个慢动作。换句话说这里有三个部分:
可迭代对象(Iterable)
Python中任意的对象,只要它定义了可以返回一个迭代器的__iter__
方法,或者定义了可以支持下标索引的__getitem__
方法(这些双下划线方法会在其他章节中全面解释),那么它就是一个可迭代对象。
简单说,可迭代对象就是能提供迭代器的任意对象。那迭代器又是什么呢?
迭代器(Iterator)
任意对象,只要定义了next(Python2) 或者__next__
方法,它就是一个迭代器。就这么简单。现在我们来理解迭代(iteration)
迭代(Iteration)
首先迭代是一个过程。
用简单的话讲,它就是从某个地方(比如一个列表)取出一个元素的过程。当我们使用一个循环来遍历某个东西时,这个过程本身就叫迭代。现在既然我们有了这些术语的基本理解,那我们开始理解生成器吧。
生成器是迭代器的一种,但是你只能对其迭代一次。这是因为它们并没有把所有的值存在内存中,而是在运行时生成值。
你通过遍历来使用它们,要么用一个“for”循环,要么将它们传递给任意可以进行迭代的函数和结构。大多数时候生成器是以函数来实现的。然而,它们并不返回一个值,而是yield(暂且译作“生出”)一个值。这里有个生成器函数的简单例子:
# 定义一个生成器函数
def generator_function():
for i in range(10):
yield i
# 遍历这个生成器函数
for item in generator_function():
print(item)
# 输出结果:
# 0
# 1
# 2
# 3
# 4
# 5
# 6
# 7
# 8
# 9
这个案例并不是非常能说明生成器的优势。
应用生成器的最佳场景是:你不想同一时间将所有计算出来的大量结果集分配到内存当中,特别是结果集里还包含循环。
译者注:这样做会消耗大量内存资源
许多Python 2里的标准库函数都会返回列表,而Python 3都修改成了返回生成器,因为生成器占用更少的资源。(官方已不再支持Python2)
下面是一个计算斐波那契数列的生成器:
# 定义一个斐波拉契生成器函数
def fibon(n):
a = b = 1
for i in range(n):
yield a
a, b = b, a + b
函数使用方法如下:
for x in fibon(100):
print(x)
下次继续...
网友评论