浅析python迭代器

作者: __Aster__ | 来源:发表于2017-03-10 16:02 被阅读0次

可迭代对象Iterable

可迭代对象是什么?简单点说,那些能被for循环的对象就是可迭代对象。精确一点来说可迭代对象是指有iter( )方法来返回一个迭代器的对象。而for循环就只能用于这些对象上。(什么是迭代器?我们等一下来讲)
典型的可迭代对象包括String,list,dict,set等。for循环的过程本身就是迭代过程。
通过isinstance()来判断某个实体是否是可迭代对象。

from collections import Iterable
from collections import Iterator

x = {1,2,3}#x是一个set
for i in x:
    print(i)
1
2
3
isinstance(x,Iterable)
True

迭代器Iterator

可被迭代对象为何可以使用for循环呢?这是因为在这些对象里面都有隐藏函数iter( )来获取其迭代器。
凡是有iter( )方法的对象都是可迭代对象Iterable。例如我们可以随便自己定义一个Iterable对象。

class it(object):
    def __iter__(self):
        pass
i = it()
isinstance(i,Iterable)
True

那么什么是迭代器(Iterator)呢?从本质上来说,凡是同时有iter( )和next( )方法的都是迭代器。注意,一般来说Iterable的iter( )方法会返回它的迭代器,而迭代器的iter( )方法则会直接返回它自身。
迭代器的核心就在于next( )方法,有了这个方法的对象可以通过内建函数next()来迭代得到下一个值。
以最简单的list来举例子:

x = list(range(20))#x是一个可迭代对象Iterable
it = iter(x)#it是x的迭代器Iterator
print(next(it))
print(next(it))
print(next(it))
0
1
2

因此我们也可以揭开python中for循环的本质了,for循环之所以能够作用于Iterable类型的对象,是因为for循环本身等价于取该对象的迭代器,然后不停的next()直到结束。

for i in range(20):
    XXX#执行循环内容

等价于:

tempi = iter(range(20))
i = next(tempi)
XXX#执行循环内容
i = next(tempi)
XXX#执行循环内容
i = next(tempi)
XXX#执行循环内容
...
...
#直到next函数结束

因此我们也可以自己写一个Iterable对象,并用for循环作用于它。比如我们想写一个能够被for循环输出斐波那契数列的类:

class fib(object):
    def __init__(self,n=20):
        self.n = n
    def __iter__(self):
        return fibiter(self.n)

class fibiter(object):
    def __init__(self,n):
        self.max = n
        self.a = 0
        self.b = 1
    def __iter__(self):
        return self
    def __next__(self):
        while(self.b<self.max):
            temp = self.a+self.b
            self.a = self.b
            self.b = temp
            return self.a
        raise StopIteration #很重要,必须要抛出StopIteration异常,不然for循环将不会终止

for i in fib():
    print(i)
1
1
2
3
5
8
13

上面的程序中,fib类创建的对象是可迭代对象Iterable,因为它有iter( )方法来返回一个迭代器fibiter。而fibiter则是一个典型的迭代器Iterator,通过next方法来不断的迭代出下一个值。因此我们可以通过for循环来访问fib类的对象。

不过值得注意的是我们也可以直接通过for循环来访问一个Iterator,这是因为python强制规定了作为一个Iterator,除了要有next( )方法之外,还要有iter( )方法。那么就很容易理解了,Iterator的iter( )方法一般返回的是自身。因此当for循环作用于Iterator对象的时候,首先会用iter()方法返回自己本身,然后再调用next方法取下一个值。

这样就方便了我们使用Iterator的时候,不用一个个的next来取值,可以直接用for循环。
那么就有人问了,这样的Iterator本质上岂不是就是一个Iterable吗?答案是:没错,就是这样。

it = iter(fib())
print(isinstance(it,Iterator),isinstance(it,Iterable))
True True

因此有时候为了简单,不将可迭代对象和他的迭代器拆开,直接将二者合二为一写成一个即是Iterable也是Iterator的可迭代对象(也可以称为迭代器)。例如刚才的fib数列类可以改成:

class fib_1(object):
    def __init__(self,n=20):
        self.n = n
        self.a = 0
        self.b = 1
    def __iter__(self):
        return self
    def __next__(self):
        while(self.b<=self.n):
            temp = self.a+self.b
            self.a = self.b
            self.b = temp
            return self.a
        raise StopIteration
        
for i in fib_1(30):
    print(i)
1
1
2
3
5
8
13
21

相关文章

网友评论

    本文标题:浅析python迭代器

    本文链接:https://www.haomeiwen.com/subject/zvfogttx.html