A. python的多進程模塊multiprocessing
眾所周知,Python中不存在真正的多線程,Python中的多線程是一個並發過程。如果想要並行的執行程序,充分的利用cpu資源(cpu核心),還是需要使用多進程解決的。其中multiprocessing模塊應該是Python中最常用的多進程模塊了。
基本上multiprocessing這個模塊和threading這個模塊用法是相同的,也是可以通過函數和類創建進程。
上述案例基本上就是筆者搬用了上篇文章多線程的案例,可見其使用的相似之處。導入multiprocessing後實例化Process就可以創建一個進程,參數的話也是和多線程一樣,target放置進程執行函數,args存放該函數的參數。
使用類來創建進程也是需要先繼承multiprocessing.Process並且實現其init方法。
Pool可以提供指定數量的進程,供用戶調用,當有新的請求提交到pool中時,如果池還沒有滿,那麼就會創建一個新的進程用來執行該請求。
但如果池中的進程數已經達到規定最大值,那麼該請求就會等待,直到池中有進程結束,才會創建新的進程。
需要注意的是,在調用join方法阻塞進程前,需要先調用close方法,,否則程序會出錯。
在上述案例中,提到了非阻塞,當把創建進程的方法換為pool.apply(func, (msg,))時,就會阻塞進程,出現下面的狀況。
在multiprocessing模塊中還存在Queue對象,這是一個進程的安全隊列,近似queue.Queue。隊列一般也是需要配合多線程或者多進程使用。
下列案例是一個使用進程隊列實現的生產者消費者模式。
multiprocessing支持兩種進程間的通信,其中一種便是上述案例的隊列,另一種則稱作管道。在官方文檔的描述中,multiprocessing中的隊列是基於管道實現的,並且擁有更高的讀寫效率。
管道可以理解為進程間的通道,使用Pipe([plex])創建,並返回一個元組(conn1,conn2)。如果plex被置為True(默認值),那麼該管道是雙向的,如果plex被置為False,那麼該管道是單向的,即conn1隻能用於接收消息,而conn2僅能用於發送消息。
其中conn1、conn2表示管道兩端的連接對象,每個連接對象都有send()和recv()方法。send和recv方法分別是發送和接受消息的方法。例如,可以調用conn1.send發送消息,conn1.recv接收消息。如果沒有消息可接收,recv方法會一直阻塞。如果管道已經被關閉,那麼recv方法會拋出EOFError。
關於multiprocessing模塊其實還有很多實用的類和方法,由於篇幅有限(懶),筆者就先寫到這里。該模塊其實用起來很像threading模塊,像鎖對象和守護線程(進程)等multiprocessing模塊也是有的,使用方法也近乎相同。
如果想要更加詳細的了解multiprocessing模塊,請參考官方文檔。
B. 有哪些好用的Python庫
Python作為一門膠水語言,第三方庫眾多,下面我簡單介紹幾個好用的Python庫:
tensorflow
這是谷歌非常著名的一個開源機器學習框架,在業界非常受歡迎,可以靈活、快速的構建大規模機器學習應用(如神經網路等),性能和可移植性都非常不錯,支持GPU並行計算,如果你對機器學習比較感興趣,也想深入了解一下的話,可以學習一下這個框架,非常不錯:
pandas
如果你對數據分析比較感興趣,那麼pandas就是一個非常不錯的選擇,專門為數據分析而建,內置的函數和方法可以快速處理Excel,CSV等文件,而且提供了實時分析功能,代碼量更少,使用起來也更方便,對於數據處理來說,是一個非常不錯的分析工具:
matplotlib
這是Python的一個數據可視化庫,可以快速製作我們常見的圖表,如柱狀圖、餅狀圖、散點圖等,當然,也不僅僅限於這些,還有很多,如果你想畫出更多美麗的圖表,可以考慮學習一下這個庫,非常值得學習,當然,seaborn,pyecharts等這些可視化庫也非常不錯:
tushare
如果你對金融財經比較感興趣,想快速獲取股票等行情數據,也不想編寫復雜的處理代碼,那麼tushare就是一個非常不錯的選擇,自動整合了國內大部分金融財經數據,完成了數據從採集、清洗和存儲的全過程,只需簡單的幾行代碼就可以實時快速獲取到你所想要的數據,免費且開源:
PyQt
這是Python的一個GUI開發庫,如果你想快速創建一個桌面GUI程序,想直接拖拽控制項布局界面的話,那麼PyQt就是一個非常不錯的選擇,基於Qt的QtDesigner設計工具,你可以直接拖拽Qt大量的控制項快速構建出你自己的桌面應用,簡單而又快捷:
Kivy
如果你想利用Python開發一個安卓應用,那麼kivy就是一個非常不錯的選擇,這是Python的一個開源、跨平台的GUI庫,只需要編寫一套代碼,即可運行在大部分桌面及移動平台上,包括winsows,linux,ios,android等,非常不錯:
scrapy
這是Python的一個爬蟲框架,在也就非常受歡迎,如果你想快速的定製自己的爬蟲程序,又不想重復的造輪子的話,可以學習一下這個庫,只需要添加少量的代碼,就可啟動屬於自己的一個爬蟲應用,非常方便:
django
這是一個流行的PythonWeb框架,如果你想快速構建一個自己的web應用,那麼這個框架就非常值得學習,成熟穩重,基於MVC模式,使用起來非常方便,當然,也有輕量級的web框架,如flask,tornado等,也都非常不錯:
pygame
如果你想快速開發一個小型游戲,又不想低級語言的束縛,可以考慮學習一下這個庫,非常簡單,只需要少量的代碼便可構建一個游戲應用,當然,它也是一個非常不錯的GUI庫,對於桌面開發來說,也是一個不錯的選擇:
you-get
這是Python的一個視頻、音頻下載庫,如果你想免費快速下載優派卜酷、B站、騰訊等網站的視頻,安裝這個庫後,只塵豎穗需要簡單的一行命令就可直接下載,非常方便,纖嘩而且還可以在線觀看,查看視頻文件格式及清晰度等,當然,圖片也可直接下載:
就介紹這10個不錯的Python庫吧,對於日常學習開發來說,非常不錯,當然,還有許多其他好用的Python庫,這個可以到網上搜索一下,非常多,也歡迎大家留言補充。
C. python實現多線程並發執行
由於停服維護的需求(服務越來越多的原因),此前編寫的shell腳本執行速度緩慢(for循環,這就會很慢),為提高執行速度,參考很多資料,完成此腳本,實現並發執行機制.(當然這是測試腳本,有需要的同學,拿去改ba改ba,應該就可以用了)
此處腳本參考了 https://www.jb51.net/article/86053.htm
D. python並發編程-線程(threading模塊)
multiprocess模塊 的完全模仿了threading模塊的介面,二者在使用層戚州面,有很大的相似性,因而不再詳細介紹, 相關知識點可以看這里
1.誰的開啟速度快
3.同一進程內的線程共享該進程的數據?
主線程等待高虧蔽子空激線程結束
E. python並發編程-隊列介紹
進程彼此之間互相隔離,要實現進程間通信(IPC),multiprocessing模塊支持兩種形式:隊列和管道(不推薦使用),這兩種方式都是使用消息傳遞的
創建隊列的類(底層就是以管道和鎖定的方式實現) :
參數介紹:
方法介紹:
主要方法:
其他方法(了解):
F. python並發編程-Gevent包介紹
Gevent 是一個第三方庫,可以輕鬆通過gevent實現並發同步或中坦舉非同步編程,在gevent中用到的主要模式是Greenlet, 它是以C擴展模塊形式接入Python的輕量級協程。 Greenlet全部運行在主程序操作系統進程的內部,但它們被協作式地調度。信雀
遇到IO阻塞時會自動切換任務
上例gevent.sleep(2)模擬的是gevent可以識別的io阻塞,
而time.sleep(2)或其他的阻塞,gevent是不能直接識別的需要用下面一行代碼,打補丁,就可以識別了
from gevent import monkey;monkey.patch_all()必須放到被打補丁者的前面,如time,socket模塊之前
我們可以用threading.current_thread().getName()來查看每個g1和g2,查看的結果為DummyThread-n,即假賣碧線程
通過gevent實現單線程下的socket並發(from gevent import monkey;monkey.patch_all()一定要放到導入socket模塊之前,否則gevent無法識別socket的阻塞)
服務端
客戶端
多線程並發多個客戶端
G. Python中級精華-並發之啟動和停止線程
為了讓代碼能夠並發執行,向創建線程並在核實的時候銷毀它。
由於目的比較單純,只是講解基礎的線程創建方法,所以可以直接使用threading庫中的Thread類來實例化一個線程對象。
例子,用戶輸入兩個數字,並且求其兩個數字的四則運算的結果:
除了以上的一些功能以外,在python線程
中沒有其他的諸如給線程發信號、設置線程調度屬性、執行任何其他高級操作的功能了,如果需要這些功能,就需要手工編寫了。
另外,需要注意的是,由於GIL(全局解釋器鎖)的存在,限制了在python解釋器當中只允許運行一個線程。基於這個原因,不停該使用python線程來處理計算密集型的任務,因為在這種任務重我們希望在多個CPU核心上實現並行處理。Python線程更適合於IO處理以及設計阻塞操作的並發執行任務(即等待IO響應或等待資料庫取出結果等)。
如何判斷線程是否已經啟動?
目的:我們載入了一個線程,但是想要知道這個線程什麼時候才會開始運行?
方法:
線程的核心特徵我認為就是不確定性,因為其什麼時候開始運行,什麼時候被打斷,什麼時候恢復執行,這不是程序員能夠控制的,而是有系統調度
來完成的。如果遇到像某個線程的運行依託於其他某個線程運行到某個狀態時該線程才能開始運行,那麼這就是線程同步
問題,同樣這個問題非常棘手。要解決這類問題我們要藉助threading中的Event對象。
Event其實和條件標記類似,勻速線程
等待某個時間發生。初始狀態時事件被設置成0。如果事件沒有被設置而線程正在等待該事件,那麼線程就會被阻塞,直到事件被設置位置,當有線程設置了這個事件之後,那麼就會喚醒正在等待事件的線程,如果線程等待的事件已經設置了,那麼線程會繼續執行。
一個例子:
如上能夠確定的是,主線程會在線程t運行結束時再運行。
H. python多線程延遲並發
python多線程延遲並發的解決方法如下:
1.python之中多線程的特點,實際上是將執行耗時長的任務放在前台,耗時短的任務放在後台,當處理器有空閑時或者是後台任務主動調用時就會將其拿到前台來執行,而在這個過程之中實際上每次還是執行的一個線程。
2.python多線程延遲並發指的則是當前python程序內有多個程序,也就是任務同時處於已啟動運行到運行完畢之間,且這幾個程序都是在同一個處理機上運行,但任一個時刻點上只有一個程序在處理機上運行。
3.python多線程延遲並發的好處就在於可以更加合理的去調配資源,因為多線程是使用CPU的多核處理器去完成任務的。而並發則是在同一處理器上完成任務,多線程實現並發的話就可以提高運行速度並且減少內存佔用。
I. python並發編程-進程池
在利用Python進行系統管理的時候,特別是同時操作多個文件目錄,或者遠程式控制制多台主機,並行操作可以節約大量的時間。多進程是實現並發的手段之一,需要注意的問題是:
例如當被操作對象數目不大時,可以直接利用multiprocessing中的Process動態成生多個進程,十幾個還好,但如果是上百個,上千個。。。手動的去限制進程數量卻又太過繁瑣,此時可以發揮進程池的功效。
我們就可以通過維護一個進程池來控制進程數目,比如httpd的進程模式,規定最小進程數和最大進程數..
ps: 對於遠程過程調用的高級應用程序而言,應該使用進程池,Pool可以提供指定數量的進程,供用戶調用,當有新的請求提交到pool中時,如果池還沒有滿,那麼就會創建一個新的進程用來執行該請求;但如果池中的進程數已經達到規定最大值,那麼該請求就會等待,直到池中有進程結束,就重用進程池中的進程。
創建進程池的類:如果指定numprocess為3,則進程池會從無到有創建三個進程,然後自始至終使用這三個進程去執行所有任務,不會開啟其他進程
參數介紹:
方法介紹:
主要方法:
其他方法(了解部分)
應用:
發現:並發開啟多個客戶端,服務端同一時間只有3個不同的pid,幹掉一個客戶端,另外一個客戶端才會進來,被3個進程之一處理
回調函數:
需要回調函數的場景:進程池中任何一個任務一旦處理完了,就立即告知主進程:我好了額,你可以處理我的結果了。主進程則調用一個函數去處理該結果,該函數即回調函數
我們可以把耗時間(阻塞)的任務放到進程池中,然後指定回調函數(主進程負責執行),這樣主進程在執行回調函數時就省去了I/O的過程,直接拿到的是任務的結果。
如果在主進程中等待進程池中所有任務都執行完畢後,再統一處理結果,則無需回調函數