迭代器与生成器

作者: 楠木cral | 来源:发表于2020-08-21 17:25 被阅读0次

    一 可迭代对象(Iterable)

    可迭代对象: 简单的说,一个对象(在Python里面一切都是对象)只要实现了只要实现了iter()方法,那么用isinstance()函数检查就是Iterable对象;

    class IterObj:
        def __iter__(self):
            return self
    

    上面定义了一个类IterObj并实现了iter方法,这个就是一个可迭代(Iterable)对象

    it = IterObj()
    print(isinstance(it, Iterable)) # true
    print(isinstance(it, Iterator)) # false
    print(isinstance(it, Generator)) # false
    

    常见的可迭代对象

    在Python中有哪些常见的可迭代对象呢?
    (1)集合或序列类型(如list、tuple、set、dict、str)
    (2)文件对象
    (3)在类中定义了iter()方法的对象,可以被认为是 Iterable对象,但自定义的可迭代对象要能在for循环中正确使用,就需要保证iter()实现必须是正确的(即可以通过内置iter()函数转成Iterator对象。关于Iterator下文还会说明,这里留下一个坑,只是记住iter()函数是能够将一个可迭代对象转成迭代器对象,然后在for中使用)
    (4)在类中实现了如果只实现getitem()的对象可以通过iter()函数转化成迭代器但其本身不是可迭代对象。所以当一个对象能够在for循环中运行,但不一定是Iterable对象。

    print(isinstance([], Iterable)) # true list 是可迭代的
    print(isinstance({}, Iterable)) # true 字典是可迭代的
    print(isinstance((), Iterable)) # true 元组是可迭代的
    print(isinstance(set(), Iterable)) # true set是可迭代的
    print(isinstance('', Iterable)) # true 字符串是可迭代的
     
    currPath = os.path.dirname(os.path.abspath(__file__))
    with open(currPath+'/model.py') as file:
     print(isinstance(file, Iterable)) # true
    

    这些内置集合或序列对象都有iter属性,即他们都实现了同名方法。但这个可迭代对象要在for循环中被使用,那么它就应该能够被内置的iter()函数调用并转化成Iterator对象。

    print(hasattr([], "__iter__")) # true
    print(hasattr({}, "__iter__")) # true
    print(hasattr((), "__iter__")) # true
    print(hasattr('', "__iter__")) # true
    
    print(iter([])) # <list_iterator object at 0x110243f28>
    print(iter({})) # <dict_keyiterator object at 0x110234408>
    print(iter(())) # <tuple_iterator object at 0x110243f28>
    print(iter('')) # <str_iterator object at 0x110243f28>
    
    

    它们都相应的转成了对应的迭代器(Iterator)对象。
    现在回过头再看看一开始定义的那个IterObj类

    class IterObj:
     
    def __iter__(self):
     return self
      
    it = IterObj()
    print(iter(it))
    

    打印出:
    Traceback (most recent call last):
    File "/Users/mac/PycharmProjects/iterable_iterator_generator.py", line 71, in <module>
    print(iter(it))
    TypeError: iter() returned non-iterator of type 'IterObj'
    出现了类型错误,意思是iter()函数不能将‘非迭代器'类型转成迭代器。
    那如何才能将一个可迭代(Iterable)对象转成迭代器(Iterator)对象呢?
    我们修改一下IterObj类的定义

    class IterObj:
     
     def __init__(self):
      self.a = [3, 5, 7, 11, 13, 17, 19]
     
     def __iter__(self):
      return iter(self.a)
    

    我们在构造方法中定义了一个名为a的列表,然后还实现了iter()方法。
    修改后的类是可以被iter()函数调用的,即也可以在for循环中使用

    it = IterObj()
    print(isinstance(it, Iterable)) # true
    print(isinstance(it, Iterator)) # false
    print(isinstance(it, Generator)) # false
    print(iter(it)) # <list_iterator object at 0x102007278>
    for i in it:
    print(i) # 将打印3、5、7、11、13、17、19元素
    

    因此在定义一个可迭代对象时,我们要非常注意iter()方法的内部实现逻辑,一般情况下,是通过一些已知的可迭代对象(例如,上文提到的集合、序列、文件等或其他正确定义的可迭代对象)来辅助我们来实现

    关于前面说明的意思是iter()函数可以将一个实现了getitem()方法的对象转成迭代器对象,也可以在for循环中使用,但是如果用isinstance()方法来检测时,它不是一个可迭代对象。

    class IterObj:
      
     def __init__(self):
      self.a = [3, 5, 7, 11, 13, 17, 19]
      
     def __getitem__(self, i):
      return self.a[i]
       
    it = IterObj()
    print(isinstance(it, Iterable)) # false
    print(isinstance(it, Iterator)) # false
    print(isinstance(it, Generator)) false
    print(hasattr(it, "__iter__")) # false
    print(iter(it)) # <iterator object at 0x10b231278>
     
    for i in it:
     print(i) # 将打印出3、5、7、11、13、17、19
    

    这个例子说明了可以在for中使用的对象,不一定是可迭代对象。

    小结:

    (1)一个可迭代的对象是实现了iter()方法的对象
    (2)它要在for循环中使用,就必须满足iter()的调用(即调用这个函数不会出错,能够正确转成一个Iterator对象)
    (3)可以通过已知的可迭代对象来辅助实现我们自定义的可迭代对象。
    (4)一个对象实现了getitem()方法可以通过iter()函数转成Iterator,即可以在for循环中使用,但它不是一个可迭代对象(可用isinstance方法检测())

    二 迭代器(Iterator)

    一个对象实现了iter()和next()方法,那么它就是一个迭代器对象
    比如:

    class IterObj:
     
     def __init__(self):
      self.a = [3, 5, 7, 11, 13, 17, 19]
     
      self.n = len(self.a)
      self.i = 0
     
     def __iter__(self):
      return iter(self.a)
     
     def __next__(self):
      while self.i < self.n:
       v = self.a[self.i]
       self.i += 1
       return v
      else:
       self.i = 0
       raise StopIteration()
    

    在IterObj中,构造函数中定义了一个列表a,列表长度n,索引i。

    it = IterObj()
    print(isinstance(it, Iterable)) # true
    print(isinstance(it, Iterator)) # true
    print(isinstance(it, Generator)) # false
    print(hasattr(it, "__iter__")) # true
    print(hasattr(it, "__next__")) # true
    
    集合和序列对象是可迭代的但不是迭代器
    from collections.abc import Iterable, Iterator
    a = [1,2]
    iter_rator = iter(a)
    print(isinstance(a, Iterable))   # True
    print(isinstance(a, Iterator))   # False
    print(isinstance(iter_rator, Iterator))  # True
    
    print(isinstance([], Iterator)) # false
    print(isinstance({}, Iterator)) # false
    print(isinstance((), Iterator)) # false
    print(isinstance(set(), Iterator)) # false
    print(isinstance('', Iterator)) # false
    
    文件对象是迭代器
    currPath = os.path.dirname(os.path.abspath(__file__))
    with open(currPath+'/model.py') as file:
     print(isinstance(file, Iterator)) # true
    

    个迭代器(Iterator)对象不仅可以在for循环中使用,还可以通过内置函数next()函数进行调用。 例如

    it = IterObj()
    next(it) # 3
    next(it) # 5
    

    三 生成器

    一个生成器既是可迭代的也是迭代器
    定义生成器有两种方式:
    (1) 列表生成器
    (2) 使用yield定义生成器函数

    g = (x * 2 for x in range(10)) # 0~18的偶数生成器 
    print(isinstance(g, Iterable)) # true
    print(isinstance(g, Iterator)) # true
    print(isinstance(g, Generator)) # true
    print(hasattr(g, "__iter__")) # true
    print(hasattr(g, "__next__")) # true
    print(next(g)) # 0
    print(next(g)) # 2
    

    列表生成器可以不需要消耗大量的内存来生成一个巨大的列表,只有在需要数据的时候才会进行计算。
    yield方式:

    def gen():
     for i in range(10):
      yield i
    

    这里yield的作用就相当于return,这个函数就是顺序地返回[0,10)的之间的自然数,可以通过next()或使用for循环来遍历。
    当程序遇到yield关键字时,这个生成器函数就返回了,直到再次执行了next()函数,它就会从上次函数返回的执行点继续执行,即yield退出时保存了函数执行的位置、变量等信息,再次执行时,就从这个yield退出的地方继续往下执行。
    参考:https://www.jb51.net/article/161138.htm

    相关文章

      网友评论

        本文标题:迭代器与生成器

        本文链接:https://www.haomeiwen.com/subject/urzujktx.html