美文网首页Python打卡学习
迭代器和生成器的知识点一

迭代器和生成器的知识点一

作者: shenyoujian | 来源:发表于2018-06-07 01:25 被阅读1次

1、迭代器模式(Iterator Pattern)

扫描内存存放不下的数据集时,我们要找到一种惰性获取数据项的方式,即按需一次获取一个数据项,这就是迭代器模式。

2、生成器与迭代器的关系和基本概念

所有的生成器都是迭代器,迭代器用于从集合中取出元素,而生成器用于’凭空生成元素‘。

3、迭代器支持所支持的:

  • 所有集合都可以迭代
  • for循环
  • 逐行遍历文本文件
  • 列表推导、字典推导和集合推导
  • 元组拆包
  • 调用函数时,使用*拆包实参数

4、iter(...)内置函数如何把序列变得可以迭代

  • 为什么所有的序列都可以迭代(都是可迭代对象)?
  • Sentence类第一版:单词序列
# -*- utf8 -*-

import re
import reprlib

RE_WORD = re.compile('\w+')

class Sentence:
    """
    re.findall函数返回一个字符串列表,里面的元素是正则表达式的全部非重叠匹配
    self.words中保存的是。findall函数返回的结果,因此直接返回指定索引位上的单词
    为了完善序列协议,我们实现了__len__方法,不过,为了让对象可以迭代,没必要实现这个方法
    reprlib.repr这个实用函数用于生成大型数据结构的简略字符串表示形式
    """

    def __init__(self, text):
        self.text = text
        self.words = RE_WORD.findall(text)


    def __getitem__(self, index):
        return self.words[index]


    def __len__(self):
        return len(self.words)


    def __repr__(self):
        return 'Sentence(%s)' % reprlib.repr(self.text)


s = Sentence('"The time has come," the Walrus said,')
print(s)
for word in s:
    print(word)

#Sentence('"The time ha... Walrus said,')
#The
#time
#has
#come
#the
#Walrus
#said

  • 当for循环迭代s对象的时候,会自动调用iter(s),iter是python的内置函数
  • iter函数有三个作用,1、检查s对象是否实现了__ iter __方法,如果实现就调用它,获取一个迭代器。2、如果没有实现__ iter __方法,但是实现了__ getitem __方法,Python会创建一个迭代器,尝试按顺序(从索引0开始)获取元素。3、如果尝试失败,Python抛出TypeError异常,通常是TypeError: 'Sentence' object is not iterable
  • 当你给上面的__ getitem __函数改名字或者去掉,再运行就会报错。

5、可迭代对象与迭代器的对比

  • 如果对象实现了能返回迭代器的__ iter __方法或者实现了__ getitem __方法并且其参数是从零开始的索引,这些对象通通都称为可迭代的对象。
  • 所以明确可迭代的对象和迭代器之间的关系是:Python从可迭代的对象中获取迭代器。
# ’ABC‘为可迭代的对象,背后是有迭代器的,只是我们看不到。
s = 'ABC'
for char in s:
    print(char)



# 使用可迭代对象构建迭代器it
# 不断在迭代器上调用next函数,获取下一个字符。
# 如果没有字符了,迭代器会抛出StopIteration异常。
# 释放对it的引用,废弃迭代器对象
# 退出循环
s = 'ABC'
it = iter(s)
while True:
    try:
        print(next(it))
    except StopIteration:
        del it
        break
  • 上面都是输出ABC,可以看到Python语言内部会处理for循环和其他迭代上下文(列表推导,元组拆包等)中的StopIteration异常。而while没有得自己捕获。
  • 标准的迭代器中有两个方法:
    __ next __ 返回下一个可用元素,如果没有元素了,就抛出StopIteraction异常。
    __ iter __ 返回self,以便在应该使用可迭代对象的地方使用迭代器,例如for循环。
s3 = Sentence('Pig and Pepper')
it = iter(s3)
print(it)
# <iterator object at 0x000001C5379615F8>
print(next(it))
# Pig
print(next(it))
# and
print(next(it))
# Pepper
next(it)
# TypeError: 'Sentence' object is not iterable
list(it)
# []
list(iter(s3))
# ['Pig', 'and', 'Pepper']
  • 使用iter()函数构造迭代器,使用next函数使用迭代器
  • 传入迭代器无法还原已经耗尽的迭代器。,只能再次调用iter函数重新构建迭代器。

6、迭代器的定义

迭代器是这样的对象,实现了无参数的__ next __方法,返回序列中的下一个元素,如果没有元素了,就抛出异常。Python中迭代器还实现了__ iter __方法,因此迭代器也可以迭代。

相关文章

网友评论

    本文标题:迭代器和生成器的知识点一

    本文链接:https://www.haomeiwen.com/subject/uctwsftx.html