㈠ python中可迭代對象、迭代器以及iter()函數的兩個用法詳解
在Python編程中,理解可迭代對象(Iterable)、迭代器(Iterator)以及iter()函數的使用至關重要。首先,我們先來澄清兩個基本概念:可迭代對象包括列表、元組、字元串等,它們都具備通過for循環遍歷元素的特性。Python內置的Iterable類和collections.abc模塊中的方法可以用來檢測一個對象是否為可迭代對象,這依賴於對象是否實現了__iter__()方法。
如果一個對象沒有__iter__()方法,但有__getitem__(),解釋器會創造一個迭代器並按序獲取元素。若兩者皆無,會拋出TypeError。我們可以通過自定義對象並實現這兩個方法來理解這個過程。
迭代器則更進一步,它是一個能記住遍歷位置的特殊對象,只能向前推進。迭代器必須實現__iter__和__next__方法,分別用於返回迭代器和獲取下一個元素。例如,當我們通過next(iterator)獲取下一個值時,如果沒有更多元素,會拋出StopIteration異常。
iter()函數有兩個常見用法。第一個是iter(iterable),將可迭代對象轉換為迭代器,以便進一步操作。第二個是iter(callable, sentinel),這里callable可以是任何可調用對象,sentinel作為標記值,當函數返回這個值時,迭代器會結束並拋出StopIteration異常。
舉個例子,test_iter函數通過iter(callable, sentinel)的第二個用法,創建了一個特殊的迭代器,當函數返回特定值時,會終止迭代。這就是iter()函數的另一個實用場景。
總的來說,掌握Python中的這些概念和函數,能幫助你更有效地處理數據和迭代過程。
㈡ Python中的「迭代」詳解
迭代器模式:一種惰性獲取數據項的方式,即按需一次獲取一個數據項。
所有序列都是可以迭代的。我們接下來要實現一個 Sentence(句子)類,我們向這個類的構造方法傳入包含一些文本的字元串,然後可以逐個單詞迭代。
接下來測試 Sentence 實例能否迭代
序列可以迭代的原因:
iter()
解釋器需要迭代對象 x 時,會自動調用iter(x)。
內置的 iter 函數有以下作用:
由於序列都實現了 __getitem__ 方法,所以都可以迭代。
可迭代對象:使用內置函數 iter() 可以獲取迭代器的對象。
與迭代器的關系:Python 從可迭代對象中獲取迭代器。
下面用for循環迭代一個字元串,這里字元串 'abc' 是可迭代的對象,用 for 循環迭代時是有生成器,只是 Python 隱藏了。
如果沒有 for 語句,使用 while 循環模擬,要寫成下面這樣:
Python 內部會處理 for 循環和其他迭代上下文(如列表推導,元組拆包等等)中的 StopIteration 異常。
標準的迭代器介面有兩個方法:
__next__ :返回下一個可用的元素,如果沒有元素了,拋出 StopIteration 異常。
__iter__ :返回 self,以便在需要使用可迭代對象的地方使用迭代器,如 for 循環中。
迭代器:實現了無參數的 __next__ 方法,返回序列中的下一個元素;如果沒有元素了,那麼拋出 StopIteration 異常。Python 中的迭代器還實現了 __iter__ 方法,因此迭代器也可以迭代。
接下來使用迭代器模式實現 Sentence 類:
注意, 不要 在 Sentence 類中實現 __next__ 方法,讓 Sentence 實例既是可迭代對象,也是自身的迭代器。
為了「支持多種遍歷」,必須能從同一個可迭代的實例中獲取多個獨立的迭代器,而且各個迭代器要能維護自身的內部狀態,因此這一模式正確的實現方式是,每次調用 iter(my_iterable) 都新建一個獨立的迭代器。
所以總結下來就是:
實現相同功能,但卻符合 Python 習慣的方式是,用生成器函數代替 SentenceIteror 類。
只要 Python 函數的定義體中有 yield 關鍵字,該函數就是生成器函數。調用生成器函數,就會返回一個生成器對象。
生成器函數會創建一個生成器對象,包裝生成器函數的定義體,把生成器傳給 next(...) 函數時,生成器函數會向前,執行函數定義體中的下一個 yield 語句,返回產出的值,並在函數定義體的當前位置暫停,。最終,函數的定義體返回時,外層的生成器對象會拋出 StopIteration 異常,這一點與迭代器協議一致。
如今這一版 Sentence 類相較之前簡短多了,但是還不夠慵懶。 惰性 ,是如今人們認為最好的特質。惰性實現是指盡可能延後生成值,這樣做能節省內存,或許還能避免做無用的處理。
目前實現的幾版 Sentence 類都不具有惰性,因為 __init__ 方法急迫的構建好了文本中的單詞列表,然後將其綁定到 self.words 屬性上。這樣就得處理整個文本,列表使用的內存量可能與文本本身一樣多(或許更多,取決於文本中有多少非單詞字元)。
re.finditer 函數是 re.findall 函數的惰性版本,返回的是一個生成器,按需生成 re.MatchObject 實例。我們可以使用這個函數來讓 Sentence 類變得懶惰,即只在需要時才生成下一個單詞。
標准庫提供了很多生成器函數,有用於逐行迭代純文本文件的對象,還有出色的 os.walk 函數等等。本節專注於通用的函數:參數為任意的可迭代對象,返回值是生成器,用於生成選中的、計算出的和重新排列的元素。
第一組是用於 過濾 的生成器函數:從輸入的可迭代對象中產出元素的子集,而且不修改元素本身。這種函數大多數都接受一個斷言參數(predicate),這個參數是個 布爾函數 ,有一個參數,會應用到輸入中的每個元素上,用於判斷元素是否包含在輸出中。
以下為這些函數的演示:
第二組是用於映射的生成器函數:在輸入的單個/多個可迭代對象中的各個元素上做計算,然後返回結果。
以下為這些函數的用法:
第三組是用於合並的生成器函數,這些函數都可以從輸入的多個可迭代對象中產出元素。
以下為演示:
第四組是從一個元素中產出多個值,擴展輸入的可迭代對象。
以下為演示:
第五組生成器函數用於產出輸入的可迭代對象中的全部元素,不過會以某種方式重新排列。
下面的函數都接受一個可迭代的對象,然後返回單個結果,這種函數叫「歸約函數」,「合攏函數」或「累加函數」,其實,這些內置函數都可以用 functools.rece 函數實現,但內置更加方便,而且還有一些優點。
參考教程:
《流暢的python》 P330 - 363
㈢ Python基礎之迭代器
一.什麼是迭代器
迭代器是用來迭代取值的工具。
而涉及到把多個值循環取出來的類型有:列表,字元串,元組,欄位,集合,打開文件等。通過使用的遍歷方式有for···in···,while等,但是,這些方式只適用於有索引的數據類型。為了解決索引取的局限性,python提供了一種 不依賴於索引的取值方式:迭代器
注意:
二.可迭代對象
可迭代對象:但凡內置有__iter__方法的都稱為可迭代對象
常見的可迭代對象:
1.集合數據類型,如list,tuple,dict,set,str等
2.生成器,包括生成器和帶yield的生成器函數。
三.如何創建迭代器
迭代器是一個包含數個值的對象。
迭代器是可以迭代的對象,這意味著您可以遍歷所有值。
從技術上講,在Python中,迭代器是實現迭代器協議的對象,該協議由方法 __iter__() 和 __next__() 組成。
簡而言之,一個類裡面實現了__iter__()和__next__()這兩個魔法方法,那麼這個類的對象就是可迭代對象。
四.迭代器的優缺點
1.優點
2.缺點
五.迭代器示例
另外,如果類Stu繼承了Iterator,那麼Stu可以不用實現__iter__()方法
遍歷迭代器
StopIteration
如果你有足夠的 next() 語句,或者在 for 循環中使用,則上面的例子將永遠進行下去。
為了防止迭代永遠進行,我們可以使用 StopIteration 語句。
在 __next__() 方法中,如果迭代完成指定的次數,我們可以添加一個終止條件來引發錯誤