1. python 函數 - 返回生成器
如果函數要返回一系列結果,我們常見的方法就是將結果放到一份列表中,然後返回給調用者。比如下面的函數,返回字元串中每個單詞的首字首皮母在真個字元串中的索引:
運行結果:
上述的結果完全符合我們的預期,但 get_word_index 函數不夠簡潔。下襲燃面我們嘗試使用生成器來實現:
運行結果:
改寫之後,不僅運行結果符合要求,由於不需要和 result 列表交互,函數也變得非常簡潔。下面我們就來詳細學習下生成器吧~
生成器是指使用 yield 表達式的函數,調用生成器函數時,它並不會真的運行,而是會返回迭代器。每次在這個迭代器上面調用內置的 next 函數時,迭代器就會把生成器推進到下一個 yield 表達式那裡。生成器傳給 yield 的值均會由迭代器返回給調用者。
此外,如果輸入量非常大,使用列表作為返回值,那拍芹虛么程序就有可能耗盡內存並崩潰。相反,使用生成器之後,則可以應對任意長度的輸入數據。
例如,下面這個生成器函數可以獲取文件中單詞的索引,而不管文件內容多大,該函數執行時消耗的內存,只由單行的文本長度決定:
其中 test_generator.txt 中的內容如下:
運行結果:
下面這句話特別重要: 生成器函數返回的迭代器,是由狀態的,及調用者不應該反復使用它 。我們那 word_index_iter 來說明:
如果想重復調用,請將其封裝成容器:
運行結果:
關於上述自定義容器的實現原理,我的另外一篇文章做了詳細介紹,鏈接奉上: https://www.jianshu.com/p/0bae644d393a
2. python生成器主要用在哪裡
就是生成相關數據,比如破解wifi密碼,生成很多密碼,通過python一個個試。
3. python生成器是怎樣工作的
1、主要是開發快,語言簡潔,沒那麼多技巧,所以讀起來很清楚容易。 2、C/C++可以寫python的mole,標准庫鋒歷里就有用液喚C/C++寫的東鬧基凱西,這個跟java的JNI類似。 3、python的gui一般是用tkinter,就是tk的python的wrapper。python沒有像xna那麼方便的...
是,可以叫高階函式,在Python中,這種一邊迴圈一邊計算的機制,稱為生成器(Generator)。
4. Python中生成器的理解
9.10. 生成器
Generator 是創建迭代器的簡單而強大的工具。它們寫起來就像是正規的函數,需要返回數據的時候使用 yield 語句。每次 next() 被調用時,生成器回復它脫離的位置(它記憶語句最後一次執行的位置和所有的數據值)。以下示例演示了生成器可以很簡單的創建出來:
前一節中描述了基於類的迭代器,它能作的每一件事生成器也能作到。因為自動創建了 __iter__() 和 __next__() 方法,生成器顯得如此簡潔。
另一個關鍵的功能在於兩次執行之間,局部變數和執行狀態都自動的保存下來。這使函數很容易寫,而且比使用 self.index 和 self.data 之類的方式更清晰。
除了創建和保存程序狀態的自動方法,當發生器終結時,還會自動拋出 StopIteration 異常。綜上所述,這些功能使得編寫一個正規函數成為創建迭代器的最簡單方法。
Generator 是創建迭代器的簡單而強大的工具。它們寫起來就像是正規的函數,需要返回數據的時候使用 yield 語句。每次 next() 被調用時,生成器回復它脫離的位置(它記憶語句最後一次執行的位置和所有的數據值)。以下示例演示了生成器可以很簡單的創建出來:
前一節中描述了基於類的迭代器,它能作的每一件事生成器也能作到。因為自動創建了 __iter__() 和 __next__() 方法,生成器顯得如此簡潔。
另一個關鍵的功能在於兩次執行之間,局部變數和執行狀態都自動的保存下來。這使函數很容易寫,而且比使用 self.index 和 self.data 之類的方式更清晰。
除了創建和保存程序狀態的自動方法,當發生器終結時,還會自動拋出 StopIteration 異常。綜上所述,這些功能使得編寫一個正規函數成為創建迭代器的最簡單方法。
5. python生成器是怎麼使用的
生成器(generator)概念
生成器不會把結果保存在一個系列中,而是保存生成器的狀態,在每次進行迭代時返回一個值,直到遇到StopIteration異常結束。
生成器語法
生成器表達式: 通列表解析語法,只不過把列表解析的[]換成()
生成器表達式能做的事情列表解析基本都能處理,只不過在需要處理的序列比較大時,列表解析比較費內存。
Python
1
2
3
4
5
6
7
8
9
10
11
>>> gen = (x**2 for x in range(5))
>>> gen
<generator object <genexpr> at 0x0000000002FB7B40>
>>> for g in gen:
... print(g, end='-')
...
0-1-4-9-16-
>>> for x in [0,1,2,3,4,5]:
... print(x, end='-')
...
0-1-2-3-4-5-
生成器函數: 在函數中如果出現了yield關鍵字,那麼該函數就不再是普通函數,而是生成器函數。
但是生成器函數可以生產一個無線的序列,這樣列表根本沒有辦法進行處理。
yield 的作用就是把一個函數變成一個 generator,帶有 yield 的函數不再是一個普通函數,Python 解釋器會將其視為一個 generator。
下面為一個可以無窮生產奇數的生成器函數。
Python
1
2
3
4
5
6
7
8
9
10
11
def odd():
n=1
while True:
yield n
n+=2
odd_num = odd()
count = 0
for o in odd_num:
if count >=5: break
print(o)
count +=1
當然通過手動編寫迭代器可以實現類似的效果,只不過生成器更加直觀易懂
Python
1
2
3
4
5
6
7
8
9
10
11
class Iter:
def __init__(self):
self.start=-1
def __iter__(self):
return self
def __next__(self):
self.start +=2
return self.start
I = Iter()
for count in range(5):
print(next(I))
題外話: 生成器是包含有__iter()和next__()方法的,所以可以直接使用for來迭代,而沒有包含StopIteration的自編Iter來只能通過手動循環來迭代。
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
>>> from collections import Iterable
>>> from collections import Iterator
>>> isinstance(odd_num, Iterable)
True
>>> isinstance(odd_num, Iterator)
True
>>> iter(odd_num) is odd_num
True
>>> help(odd_num)
Help on generator object:
odd = class generator(object)
| Methods defined here:
|
| __iter__(self, /)
| Implement iter(self).
|
| __next__(self, /)
| Implement next(self).
......
看到上面的結果,現在你可以很有信心的按照Iterator的方式進行循環了吧!
在 for 循環執行時,每次循環都會執行 fab 函數內部的代碼,執行到 yield b 時,fab 函數就返回一個迭代值,下次迭代時,代碼從 yield b 的下一條語句繼續執行,而函數的本地變數看起來和上次中斷執行前是完全一樣的,於是函數繼續執行,直到再次遇到 yield。看起來就好像一個函數在正常執行的過程中被 yield 中斷了數次,每次中斷都會通過 yield 返回當前的迭代值。
yield 與 return
在一個生成器中,如果沒有return,則默認執行到函數完畢時返回StopIteration;
Python
1
2
3
4
5
6
7
8
9
10
11
>>> def g1():
... yield 1
...
>>> g=g1()
>>> next(g) #第一次調用next(g)時,會在執行完yield語句後掛起,所以此時程序並沒有執行結束。
1
>>> next(g) #程序試圖從yield語句的下一條語句開始執行,發現已經到了結尾,所以拋出StopIteration異常。
Traceback (most recent call last):
File "<stdin>", line 1, in <mole>
StopIteration
>>>
如果遇到return,如果在執行過程中 return,則直接拋出 StopIteration 終止迭代。
Python
1
2
3
4
5
6
7
8
9
10
11
12
>>> def g2():
... yield 'a'
... return
... yield 'b'
...
>>> g=g2()
>>> next(g) #程序停留在執行完yield 'a'語句後的位置。
'a'
>>> next(g) #程序發現下一條語句是return,所以拋出StopIteration異常,這樣yield 'b'語句永遠也不會執行。
Traceback (most recent call last):
File "<stdin>", line 1, in <mole>
StopIteration
如果在return後返回一個值,那麼這個值為StopIteration異常的說明,不是程序的返回值。
生成器沒有辦法使用return來返回值。
Python
1
2
3
4
5
6
7
8
9
10
11
>>> def g3():
... yield 'hello'
... return 'world'
...
>>> g=g3()
>>> next(g)
'hello'
>>> next(g)
Traceback (most recent call last):
File "<stdin>", line 1, in <mole>
StopIteration: world
生成器支持的方法
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
>>> help(odd_num)
Help on generator object:
odd = class generator(object)
| Methods defined here:
......
| close(...)
| close() -> raise GeneratorExit inside generator.
|
| send(...)
| send(arg) -> send 'arg' into generator,
| return next yielded value or raise StopIteration.
|
| throw(...)
| throw(typ[,val[,tb]]) -> raise exception in generator,
| return next yielded value or raise StopIteration.
......
close()
手動關閉生成器函數,後面的調用會直接返回StopIteration異常。
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
>>> def g4():
... yield 1
... yield 2
... yield 3
...
>>> g=g4()
>>> next(g)
1
>>> g.close()
>>> next(g) #關閉後,yield 2和yield 3語句將不再起作用
Traceback (most recent call last):
File "<stdin>", line 1, in <mole>
StopIteration
send()
生成器函數最大的特點是可以接受外部傳入的一個變數,並根據變數內容計算結果後返回。
這是生成器函數最難理解的地方,也是最重要的地方,實現後面我會講到的協程就全靠它了。
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
def gen():
value=0
while True:
receive=yield value
if receive=='e':
break
value = 'got: %s' % receive
g=gen()
print(g.send(None))
print(g.send('aaa'))
print(g.send(3))
print(g.send('e'))
執行流程:
通過g.send(None)或者next(g)可以啟動生成器函數,並執行到第一個yield語句結束的位置。此時,執行完了yield語句,但是沒有給receive賦值。yield value會輸出初始值0注意:在啟動生成器函數時只能send(None),如果試圖輸入其它的值都會得到錯誤提示信息。
通過g.send(『aaa』),會傳入aaa,並賦值給receive,然後計算出value的值,並回到while頭部,執行yield value語句有停止。此時yield value會輸出」got: aaa」,然後掛起。
通過g.send(3),會重復第2步,最後輸出結果為」got: 3″
當我們g.send(『e』)時,程序會執行break然後推出循環,最後整個函數執行完畢,所以會得到StopIteration異常。
最後的執行結果如下:
Python
1
2
3
4
5
6
7
0
got: aaa
got: 3
Traceback (most recent call last):
File "h.py", line 14, in <mole>
print(g.send('e'))
StopIteration
throw()
用來向生成器函數送入一個異常,可以結束系統定義的異常,或者自定義的異常。
throw()後直接跑出異常並結束程序,或者消耗掉一個yield,或者在沒有下一個yield的時候直接進行到程序的結尾。
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
def gen():
while True:
try:
yield 'normal value'
yield 'normal value 2'
print('here')
except ValueError:
print('we got ValueError here')
except TypeError:
break
g=gen()
print(next(g))
print(g.throw(ValueError))
print(next(g))
print(g.throw(TypeError))
輸出結果為:
Python
1
2
3
4
5
6
7
8
normal value
we got ValueError here
normal value
normal value 2
Traceback (most recent call last):
File "h.py", line 15, in <mole>
print(g.throw(TypeError))
StopIteration
解釋:
print(next(g)):會輸出normal value,並停留在yield 『normal value 2』之前。
由於執行了g.throw(ValueError),所以會跳過所有後續的try語句,也就是說yield 『normal value 2』不會被執行,然後進入到except語句,列印出we got ValueError here。然後再次進入到while語句部分,消耗一個yield,所以會輸出normal value。
print(next(g)),會執行yield 『normal value 2』語句,並停留在執行完該語句後的位置。
g.throw(TypeError):會跳出try語句,從而print(『here』)不會被執行,然後執行break語句,跳出while循環,然後到達程序結尾,所以跑出StopIteration異常。
下面給出一個綜合例子,用來把一個多維列表展開,或者說扁平化多維列表)
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
def flatten(nested):
try:
#如果是字元串,那麼手動拋出TypeError。
if isinstance(nested, str):
raise TypeError
for sublist in nested:
#yield flatten(sublist)
for element in flatten(sublist):
#yield element
print('got:', element)
except TypeError:
#print('here')
yield nested
L=['aaadf',[1,2,3],2,4,[5,[6,[8,[9]],'ddf'],7]]
for num in flatten(L):
print(num)
如果理解起來有點困難,那麼把print語句的注釋打開在進行查看就比較明了了。
總結
按照鴨子模型理論,生成器就是一種迭代器,可以使用for進行迭代。
第一次執行next(generator)時,會執行完yield語句後程序進行掛起,所有的參數和狀態會進行保存。再一次執行next(generator)時,會從掛起的狀態開始往後執行。在遇到程序的結尾或者遇到StopIteration時,循環結束。
可以通過generator.send(arg)來傳入參數,這是協程模型。
可以通過generator.throw(exception)來傳入一個異常。throw語句會消耗掉一個yield。可以通過generator.close()來手動關閉生成器。
next()等價於send(None)
6. python 代碼生成器怎麼用
生成器是一個包含了特殊關鍵字yield的函數。當被調用的時候,生成器函數返回一個生成器。可以使用send,throw,close方法讓生成器和外界交互。
生成器也是迭代器,但是它不僅僅是迭代器,擁有next方法並且行為和迭代器完全相同。所以生成器也可以用於python的循環中,
生成器如何使用?
首先看一個例子:
復制代碼 代碼如下:
#!/usr/bin/python
# -*- coding: utf-8 -*-
def flatten(nested):
for sublist in nested:
for element in sublist:
yield element
nested = [[1,2],[3,4],[5,6]]
for num in flatten(nested):
print num,
結果為1,2,3,4,5,6
遞歸生成器:
復制代碼 代碼如下:
#!/usr/bin/python
# -*- coding: utf-8 -*-
def flatten(nested):
try:
for sublist in nested:
for element in flatten(sublist):
yield element
except TypeError:
yield nested
for num in flatten([[1,2,3],2,4,[5,[6],7]]):
print num
結果為:1 2 3 2 4 5 6 7
讓我們一起來看看生成器的本質
首先看下:
復制代碼 代碼如下:
#!/usr/bin/python
# -*- coding: utf-8 -*-
def simple_generator():
yield 1
print simple_generator
def repeater(value):
while True:
new = (yield value)
if new is not None: value = new
r = repeater(42)
print r.next()
print r.send('hello,world!')
結果為:
復制代碼 代碼如下:
<function simple_generator at 0x10c76f6e0>
42
hello,world!
可以看出:
1)生成器就是一函數
2)生成器具有next方法
3)生成器可以使用send 方法和外界交互。
7. python生成器多次遍歷(一)------復制生成器
當python中的生成器被完整遍歷一次後,就無法再次遍歷。
我們希望享有生成器迭代占扒哪用內存小的特性,又希望這個生成器能被遍歷多次。
方案之一是使用函數 itertools.tee 來復制生成器
語法: generator1, generator2 = itertools.tee(generator, n=2)
generator是需要復制的生成器, n是復制出生成器個數,默認為2。
我們為了生成器能多次遍歷,可以這樣寫:
generator, _generator = itertools.tee(generator, 2)
然春瞎碼後遍歷_generator,保存的generator可以再次復制。
1、generator被復制後盡量不要使用
2、如果生成器中迭代的還是生成器,復神賀制最外層生成器,生成器依然只能遍歷一次。
下一篇
python生成器多次遍歷(二)------創建生成器類
8. Python Generator(生成器)
什麼是Python Generator(生成器) ?
Python Generator(生成器)用於在內存資源有限的情況下,把處鍵凳理大數據的任務,分解為一段一段可以管理和處理的數據塊(chunk),建立起數據流(data pipeline),從而一步一步的解決完大數據任務的技術。例如,假設有500G的數據待處理,內存只有32G,我們可以把數據分為200M的數據塊,然後藉助Python Generator技術,實現一邊載入數據一邊進行數據處理的效果。
生成器關鍵字yield 與 函數返回語句return的區別 :
return語句 終止函數運行並返回return語句後面的變數值;return語句後面的語句不執行。
Python生成稿握旅器可以由以下兩種方式創皮州建:
9. 閑話python 45: 淺談生成器yield
生成器似乎並不是一個經常被開發者討論的語法,因此也就沒有它的大兄弟迭代器那麼著名。大家不討論它並不是說大家都已經對它熟悉到人盡皆知,與之相反,即使是工作多年的開發者可能對生成器的運行過程還是知之甚少。這是什麼原因導致的呢?我猜想大概有以下幾點原因: (1)運行流程不同尋常,(2)日常開發不需要,(3)常常將生成器與迭代器混淆。 生成器的運行流程可以按照協程來理解,也就是說 返回中間結果,斷點繼續運行 。這與我們通常對於程序調用的理解稍有差異。這種運行模式是針對什麼樣的需求呢? 一般而言,生成器是應用於大量磁碟資源的處理。 比如一個很大的文件,每次讀取一行,下一次讀取需要以上一次讀取的位置為基礎。下面就通過代碼演示具體看看生成器的運行機制、使用方式以及與迭代器的比較。
什麼是生成器?直接用文字描述可能太過抽象,倒不如先運行一段代碼,分析這段代碼的運行流程,然後總結出自己對生成器的理解。
從以上演示可以看出,這段代碼定義漏明了一個函數,這個函數除了yield這個關鍵字之外與一般函數並沒有差異,也就是說生成器的魔法都是這個yield關鍵字引起的。 第一點,函數的返回值是一個生成器對象。 上述代碼中,直接調用這個看似普通的函數,然後將返回值列印出來,發現返回值是一個對象,而並不是普通函數的返回值。 第二點,慧搜拿可以使用next對這個生成器對象進行操作 。生成器對象天然的可以被next函數調用,然後返回在yield關鍵字後面的內容。 第三,再次調用next函數處理生成器對象,發現是從上次yield語句之後繼續運行,直到下一個yield語句返回。
生成器的運行流程確實詭異,下面還要演示一個生成器可以執行的更加詭異的操作:運行過程中向函數傳參。
返回生成器和next函數操作生成器已經並不奇怪了,但是在函數運行過程中向其傳參還是讓人驚呆了。 調用生成器的send函數傳入參數,在函數內使用yield語句的返回值接收,然後繼續運行直到下一個yield語句返回。 以前實現這種運行流程的方式是在函數中加上一個從控制台獲取數據的指令,或者提前將參數傳入,但是現在不用了,send方式使得傳入的參數可以隨著讀取到的參數變化而變化。
很多的開發者比較容易混淆生成器和迭代器,而迭代器的運行過程更加符合一般的程序調用運行流程,因此從親進度和使用熟悉度而言,大家對迭代器更有好感。比如下面演示一個對迭代器使用next方法進行操作。
從以上演示來看,大家或許會認為迭代器比生成器簡單易用得太多了。不過,如果你了解迭代前搭器的實現機制,可能就不會這么早下結論了。python內置了一些已經實現了的迭代器使用確實方便,但是如果需要自己去寫一個迭代器呢?下面這段代碼就帶大家見識以下迭代器的實現。
在python中,能被next函數操作的對象一定帶有__next__函數的實現,而能夠被迭代的對象有必須實現__iter__函數。看了這么一段操作,相信大家對迭代器實現的繁瑣也是深有體會了,那麼生成器的實現是不是會讓你覺得更加簡單易用呢?不過千萬別產生一個誤區,即生成器比迭代器簡單就多用生成器。 在實際開發中,如果遇到與大量磁碟文件或者資料庫操作相關的倒是可以使用生成器。但是在其他的任務中使用生成器難免有炫技,並且使邏輯不清晰而導致可讀性下降的嫌疑。 這大概也能解釋生成器受冷落的原因。不過作為一個專業的開發者,熟悉語言特性是分內之事。
到此,關於生成器的討論就結束了。本文的notebook版本文件在github上的cnbluegeek/notebook倉庫中共享,歡迎感興趣的朋友前往下載。
10. Python生成器簡介
Python 中的 yield 關鍵字鮮為人知,但是作用卻很大,族絕正是因為有了yield,才有了Python生成器。
yield 是 Python 的關鍵字,它用於 從函數返回而不破壞其局部變數的狀兆沒姿態 ,並且在調用該函數時,從最後一個 yield 語句開始執行。任何包含 yield 關鍵字的函數都稱為生成器。
Python 中的 yield 關鍵字的作用類似於 Python 中的 return 語句,不同之處在於:
yield的優點
yield的缺點
Python 可以使用 括弧() 創建生成器
更多時候,我們使用 yield 關鍵字創建生成器
下面這個生成器,前4次調用它時,返回的是0-3這幾個特殊值,第5次調用它時返回一個10-20之間的隨機整數。
更多時察旅候,生成器可以返回無限的值。
注意 generator() 函數返回的是一個生成器對象,要想獲取它的值,可以像上面那樣在迭代器中取出它的值,我們也可以顯式的調用next函數獲取值。
Python | yield Keyword - GeeksforGeeks:https://www.geeksforgeeks.org/python-yield-keyword/
https://c.runoob.com/compile/9/