聊迭代之前,我们也顺带简单了解一下递归:
1,递归:程序调用自身的编程技巧称为递归
应用案例:求n的阶乘
def factorial(n) :
if n == 1 :
return 1 #递归结束
return n * factorial(n - 1) #问题规模减1,递归调用
2,迭代:迭代是程序中对一组指令(或一定步骤)的重复
应用案例:读取列表中的每个元素
mylist = [1, 2, 3]
for i in mylist :
print(i)
2.1,可迭代对象是什么?
如上所示code使用了迭代的方法,而列表mylist是一个可迭代对象。当你建立了一个列表,你可以逐项地读取这个列表,而这个创建的列表就是一个可迭代对象。
2.2,迭代器是什么?
迭代器(iterator)是访问集合内元素的一种方式,提供了一种遍历类序列对象的方法。对于一般的序列,利用索引从0一直迭代到序列的最后一个元素。对象从集合的第一个元素开始访问,直到所有的元素都被访问一遍后结束。对于字典、文件、自定义对象类型等,可以自定义迭代方式,从而实现对这些对象的遍历。总之,迭起器就是定义了对对象进行遍历的方式。
而实现了迭代器规范的对象就是迭代器,规范如下:
1,实现了魔法方法 iter(),返回一个迭代对象,这个对象有一个next()方法,
2,实现 next() 方法,返回当前的元素,并指向下一个元素的位置,当前位置已经没有元素的时候,抛出StopIteration异常。
python for循环的时候,首先对循环对象实现迭代器包装,返回一个迭代器对象,然后每循环一步,就调用哪个迭代器对象的next方法,循环结束的时候,自动处理了StopIteration这个异常。for循环是对迭代器进行迭代的语法糖。
python中使用iter函数来生成一个迭代器:
>>> t = [1, 2, 3]
>>> it = iter(t)
>>> it.next()
1
生成器也是一种迭代器,但是你只能对其迭代一次。这是因为它们并没有把所有的值存在内存中,而是在运行时生成值,这样能节省大量内存空间并且提高效率。
通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。
所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。
2,yield是什么?
yield是python内部的一个关键字,内部实现支持了迭代器协议,同时yield内部是一个状态机,维护着挂起和继续的状态,yield关键字返回的就是一个生成器。
3,生成器的执行流程
代码样例:
>>> def fab(max):
... n, a, b = 0, 0, 1
... while n < max:
... yield b
... a, b = b, a + b
... n = n + 1
...
...
>>> f = fab(5)
>>> f.next()
1
>>> f.next()
1
>>> f.next()
2
>>> f.next()
3
>>> f.next()
5
>>> f.next()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
>>>
通过结果可以看到:
4,如何判断一个函数是否是一个特殊的 generator 函数?可以利用 isgeneratorfunction 判断:
>>> from inspect import isgeneratorfunction
>>> isgeneratorfunction(fab)
True
一个带有 yield 的函数就是一个 generator,它和普通函数不同,生成一个 generator 看起来像函数调用,但不会执行任何函数代码,直到对其调用 next()(在 for 循环中会自动调用 next())才开始执行。虽然执行流程仍按函数的流程执行,但每执行到一个 yield 语句就会中断,并返回一个迭代值,下次执行时从 yield 的下一个语句继续执行。看起来就好像一个函数在正常执行的过程中被 yield 中断了数次,每次中断都会通过 yield 返回当前的迭代值。
yield 的好处是显而易见的,把一个函数改写为一个 generator 就获得了迭代能力,比起用类的实例保存状态来计算下一个 next() 的值,不仅代码简洁,而且执行流程异常清晰。
原文地址:http://blog.51cto.com/leejia/2118256