Python 中 "yield" 的不同行为

在我们使用Python编译过程中，yield 关键字用于定义生成器函数，它的作用是将函数变成一个生成器，可以迭代产生值。yield 的行为在不同的情况下会有不同的效果和用途。

1、问题背景

在 Python 中，"yield" 是一种生成器（generator）的实现方式。生成器是一种特殊类型的迭代器（iterator），它可以在运行时动态产生值。然而，在某些情况下，使用生成器可能会遇到令人困惑的行为。

比如，下面有一个函数 x()，它产生一个生成器，该生成器每次调用 next() 方法时都会递减全局变量 a 的值并产生一个 yield 语句:

代码语言：javascript复制

a = 5

def x():
    global a
    if a == 3:
        raise Exception("Stop")
    a = a - 1
    yield a

现在，让我们在 Python shell 中调用这个函数并打印出生成的值：

代码语言：javascript复制

>>> print(x().next())
4
>>> print(x().next())
3

到目前为止，一切正常。但是，如果我们把生成器函数的调用结果赋值给一个变量，然后使用这个变量来产生值，就会出现不同的行为：

代码语言：javascript复制

>>> a = 5
>>> b = x()
>>> print(b.next())
4
>>> b.next()
StopIteration

这次，在第二次调用 b.next() 时，它没有产生值，而是引发了一个 StopIteration 异常。这是为什么呢？

2、解决方案

要理解这种行为，我们需要了解生成器的工作原理。

当我们调用一个生成器函数时，它并不会立即执行函数体，而是返回一个生成器对象（generator object）。这个生成器对象包含了函数体中的代码，但它不会在调用时执行。当我们使用 next() 方法来产生值时，生成器对象才会开始执行函数体。

在第一次调用 x() 时，我们创建了一个新的生成器对象。这个对象在执行函数体时遇到了 a == 3 这个条件，并引发了一个异常。然后，我们在 Python shell 中打印出了这个异常。

在第二次调用 x() 时，我们又创建了一个新的生成器对象。这个对象在执行函数体时仍然遇到了 a == 3 这个条件，并引发了异常。

但是，当我们把生成器函数的调用结果赋值给变量 b 时，情况发生了变化。这使得我们可以多次调用 b.next() 来产生值。当我们第一次调用 b.next() 时，生成器对象从上次中断的地方继续执行，并产生了值 4。

然而，当我们第二次调用 b.next() 时，生成器对象已经执行到了函数体的末尾，没有更多的值可以产生了。因此，它引发了一个 StopIteration 异常。

为了更好地理解这种行为，我们可以使用一个 for 循环来遍历生成器：

代码语言：javascript复制

def looping(stop):
    for i in looping(stop):
        yield i

>>> looping(3).next()
0
>>> looping(3).next()
0

注意，每次我们创建一个新的生成器，循环都会从头开始。然而，如果我们存储一个生成器的引用，那么循环会继续从上次中断的地方继续执行：

代码语言：javascript复制

>>> stored = looping(3)
>>> stored.next()
0
>>> stored.next()
1
>>> stored.next()
2
>>> stored.next()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration

在循环期间，每次执行 yield 语句时，代码都会暂停；调用 .next() 继续从上一时间中断的地方继续执行函数。

StopIteration 异常是完全正常的；这是生成器传达它们已经完成的方式。一个 for 循环寻找这个异常来结束循环：

代码语言：javascript复制

>>> for i in looping(3):
...     print(i)
...

0
1
2

通过上述总结我们得知，yield 在不同的上下文中有不同的行为，但都涉及到生成器的创建或者协程的定义。所以说最终选择哪种模式还得更加自身情况来选择。

python 爬虫Python 爬虫

0 人点赞