前言
在Python中可迭代(Iterable)、迭代器(Iterator)和生成器(Generator)这几个概念是经常用到的,初学时对这几个概念也是经常混淆,现在是时候把这几个概念搞清楚了。
0x00 可迭代(Iterable)
简单的说,一个对象(在Python里面一切都是对象)只要实现了只要实现了__iter__()方法,那么用isinstance()函数检查就是Iterable对象;
例如
class IterObj: def __iter__(self): # 这里简单地返回自身 # 但实际情况可能不会这么写 # 而是通过内置的可迭代对象来实现 # 下文的列子中将会展示 return self
上面定义了一个类IterObj并实现了__iter__()方法,这个就是一个可迭代(Iterable)对象
it = IterObj() print(isinstance(it, Iterable)) # true print(isinstance(it, Iterator)) # false print(isinstance(it, Generator)) # false
记住这个类,下文我们还会看到这个类的定义。
常见的可迭代对象
在Python中有哪些常见的可迭代对象呢?
关于第1、2点我们可以通过以下来验证
print(isinstance([], Iterable)) # true list 是可迭代的 print(isinstance({}, Iterable)) # true 字典是可迭代的 print(isinstance((), Iterable)) # true 元组是可迭代的 print(isinstance(set(), Iterable)) # true set是可迭代的 print(isinstance('', Iterable)) # true 字符串是可迭代的 currPath = os.path.dirname(os.path.abspath(__file__)) with open(currPath+'/model.py') as file: print(isinstance(file, Iterable)) # true
我们再来看第3点,
print(hasattr([], "__iter__")) # true print(hasattr({}, "__iter__")) # true print(hasattr((), "__iter__")) # true print(hasattr('', "__iter__")) # true
这些内置集合或序列对象都有__iter__属性,即他们都实现了同名方法。但这个可迭代对象要在for循环中被使用,那么它就应该能够被内置的iter()函数调用并转化成Iterator对象。
例如,我们看内置的可迭代对象
print(iter([])) # <list_iterator object at 0x110243f28> print(iter({})) # <dict_keyiterator object at 0x110234408> print(iter(())) # <tuple_iterator object at 0x110243f28> print(iter('')) # <str_iterator object at 0x110243f28>
它们都相应的转成了对应的迭代器(Iterator)对象。
现在回过头再看看一开始定义的那个IterObj类
class IterObj: def __iter__(self): return self it = IterObj() print(iter(it))
我们使用了iter()函数,这时候将再控制台上打印出以下信息:
Traceback (most recent call last):
File "/Users/mac/PycharmProjects/iterable_iterator_generator.py", line 71, in <module>
print(iter(it))
TypeError: iter() returned non-iterator of type 'IterObj'
出现了类型错误,意思是iter()函数不能将‘非迭代器'类型转成迭代器。
那如何才能将一个可迭代(Iterable)对象转成迭代器(Iterator)对象呢?
我们修改一下IterObj类的定义
class IterObj: def __init__(self): self.a = [3, 5, 7, 11, 13, 17, 19] def __iter__(self): return iter(self.a)
我们在构造方法中定义了一个名为a的列表,然后还实现了__iter__()方法。
修改后的类是可以被iter()函数调用的,即也可以在for循环中使用
it = IterObj() print(isinstance(it, Iterable)) # true print(isinstance(it, Iterator)) # false print(isinstance(it, Generator)) # false print(iter(it)) # <list_iterator object at 0x102007278> for i in it: print(i) # 将打印3、5、7、11、13、17、19元素
因此在定义一个可迭代对象时,我们要非常注意__iter__()方法的内部实现逻辑,一般情况下,是通过一些已知的可迭代对象(例如,上文提到的集合、序列、文件等或其他正确定义的可迭代对象)来辅助我们来实现
关于第4点说明的意思是iter()函数可以将一个实现了__getitem__()方法的对象转成迭代器对象,也可以在for循环中使用,但是如果用isinstance()方法来检测时,它不是一个可迭代对象。
class IterObj: def __init__(self): self.a = [3, 5, 7, 11, 13, 17, 19] def __getitem__(self, i): return self.a[i] it = IterObj() print(isinstance(it, Iterable)) # false print(isinstance(it, Iterator)) # false print(isinstance(it, Generator)) false print(hasattr(it, "__iter__")) # false print(iter(it)) # <iterator object at 0x10b231278> for i in it: print(i) # 将打印出3、5、7、11、13、17、19
这个例子说明了可以在for中使用的对象,不一定是可迭代对象。
现在我们做个小结:
0x01 迭代器(Iterator)
上文很多地方都提到了Iterator,现在我们把这个坑填上。
当我们对可迭代的概念了解后,对于迭代器就比较好理解了。
一个对象实现了__iter__()和__next__()方法,那么它就是一个迭代器对象。 例如
class IterObj: def __init__(self): self.a = [3, 5, 7, 11, 13, 17, 19] self.n = len(self.a) self.i = 0 def __iter__(self): return iter(self.a) def __next__(self): while self.i < self.n: v = self.a[self.i] self.i += 1 return v else: self.i = 0 raise StopIteration()
在IterObj中,构造函数中定义了一个列表a,列表长度n,索引i。
it = IterObj() print(isinstance(it, Iterable)) # true print(isinstance(it, Iterator)) # true print(isinstance(it, Generator)) # false print(hasattr(it, "__iter__")) # true print(hasattr(it, "__next__")) # true
我们可以发现上文提到的
集合和序列对象是可迭代的但不是迭代器
print(isinstance([], Iterator)) # false print(isinstance({}, Iterator)) # false print(isinstance((), Iterator)) # false print(isinstance(set(), Iterator)) # false print(isinstance('', Iterator)) # false
而文件对象是迭代器
currPath = os.path.dirname(os.path.abspath(__file__)) with open(currPath+'/model.py') as file: print(isinstance(file, Iterator)) # true
一个迭代器(Iterator)对象不仅可以在for循环中使用,还可以通过内置函数next()函数进行调用。 例如
it = IterObj() next(it) # 3 next(it) # 5
0x02 生成器(Generator)
现在我们来看看什么是生成器?
一个生成器既是可迭代的也是迭代器
定义生成器有两种方式:
先看第1种情况
g = (x * 2 for x in range(10)) # 0~18的偶数生成器 print(isinstance(g, Iterable)) # true print(isinstance(g, Iterator)) # true print(isinstance(g, Generator)) # true print(hasattr(g, "__iter__")) # true print(hasattr(g, "__next__")) # true print(next(g)) # 0 print(next(g)) # 2
列表生成器可以不需要消耗大量的内存来生成一个巨大的列表,只有在需要数据的时候才会进行计算。
再看第2种情况
def gen(): for i in range(10): yield i
这里yield的作用就相当于return,这个函数就是顺序地返回[0,10)的之间的自然数,可以通过next()或使用for循环来遍历。
当程序遇到yield关键字时,这个生成器函数就返回了,直到再次执行了next()函数,它就会从上次函数返回的执行点继续执行,即yield退出时保存了函数执行的位置、变量等信息,再次执行时,就从这个yield退出的地方继续往下执行。
在Python中利用生成器的这些特点可以实现协程。协程可以理解为一个轻量级的线程,它相对于线程处理高并发场景有很多优势。
看下面一个用协程实现的生产者-消费者模型
def producer(c): n = 0 while n < 5: n += 1 print('producer {}'.format(n)) r = c.send(n) print('consumer return {}'.format(r)) def consumer(): r = '' while True: n = yield r if not n: return print('consumer {} '.format(n)) r = 'ok' if __name__ == '__main__': c = consumer() next(c) # 启动consumer producer(c)
这段代码执行效果如下
producer 1
consumer 1
producer return ok
producer 2
consumer 2
producer return ok
producer 3
consumer 3
producer return ok
协程实现了CPU在两个函数之间进行切换从而实现并发的效果。
0x04 引用
docs.python.org/3.7/
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对小牛知识库的支持。
迭代器(Iterator) ES5实现迭代器 迭代器是什么?遇到这种新的概念,莫慌张。 迭代器是一种特殊对象,每一个迭代器对象都有一个next(),该方法返回一个对象,包括value和done属性。 ES5实现迭代器的代码如下: //实现一个返回迭代器对象的函数,注意该函数不是迭代器,返回结果才叫做迭代器。 function createIterator(items) {
本文向大家介绍Python迭代器与可迭代与生成器,包括了Python迭代器与可迭代与生成器的使用技巧和注意事项,需要的朋友参考一下 示例 一个迭代是一个对象,可以返回一个迭代器。具有状态且具有__iter__ 方法并返回迭代器的任何对象都是可迭代的。也可能是没有状态的对象,该对象实现了__getitem__方法。-该方法可以获取索引(从零开始),并IndexError在索引不再有效时引发。 Py
主要内容:一、场景引入,问题初现,二、volatile的作用及背后的原理,三、总结 & 提醒一、场景引入,问题初现 很多同学出去面试,都会被问到一个常见的问题:说说你对volatile的理解? 不少初出茅庐的同学可能会有点措手不及,因为可能就是之前没关注过这个。但是网上百度一下呢,不少文章写的很好,但是理论扎的太深,文字太多,图太少,让人有点难以理解。 基于上述痛点,这篇文章尝试站在年轻同学的角度,用最简单的大白话,加上多张图给大家说一下,volatile到底是什么? 当然本文不会把理论
迭代是Python最强大的功能之一。初看起来,你可能会简单的认为迭代只不过是处理序列中元素的一种方法。 然而,绝非仅仅就是如此,还有很多你可能不知道的, 比如创建你自己的迭代器对象,在itertools模块中使用有用的迭代模式,构造生成器函数等等。 这一章目的就是向你展示跟迭代有关的各种常见问题。 Contents: 4.1 手动遍历迭代器 4.2 代理迭代 4.3 使用生成器创建新的迭代模式 4
主要内容:实例,查找最大与最小元素,实例,获取迭代器的长度,实例,Scala Iterator 常用方法Scala 集合 Scala Iterator(迭代器)不是一个集合,它是一种用于访问集合的方法。 迭代器 it 的两个基本操作是 next 和 hasNext。 调用 it.next() 会返回迭代器的下一个元素,并且更新迭代器的状态。 调用 it.hasNext() 用于检测集合中是否还有元素。 让迭代器 it 逐个返回所有元素最简单的方法是使用 while 循环: 实例 object T
Scala 集合 Scala Iterator(迭代器)不是一个集合,它是一种用于访问集合的方法。 迭代器 it 的两个基本操作是 next 和 hasNext。 调用 it.next() 会返回迭代器的下一个元素,并且更新迭代器的状态。 调用 it.hasNext() 用于检测集合中是否还有元素。 让迭代器 it 逐个返回所有元素最简单的方法是使用 while 循环: object Test