1. python pandas用法
在Python中,pandas是基於NumPy數組構建的,使數據預處理、清洗、分析工作變得更快更簡單。pandas是專門為處理表格和混雜數據設計的,而NumPy更適合處理統一的數值數組數據。
使用下面格式約定,引入pandas包:
pandas有兩個主要數據結構:Series和DataFrame。
Series是一種類似於一維數組的對象,它由 一組數據 (各種NumPy數據類型)以及一組與之相關的 數據標簽(即索引) 組成,即index和values兩部分,可以通過索引的方式選取Series中的單個或一組值。
pd.Series(list,index=[ ]) ,第二個參數是Series中數據的索引,可以省略。
Series類型索引、切片、運算的操作類似於ndarray,同樣的類似Python字典類型的操作,包括保留字in操作、使用.get()方法。
Series和ndarray之間的主要區別在於Series之間的操作會根據索引自動對齊數據。
DataFrame是一個表格型的數據類型,每列值類型可以不同,是最常用的pandas對象。DataFrame既有行索引也有列索引,它可以被看做由Series組成的字典(共用同一個索引)。DataFrame中的數據是以一個或多個二維塊存放的(而不是列表、字典或別的一維數據結構)。
pd.DataFrame(data,columns = [ ],index = [ ]) :columns和index為指定的列、行索引,並按照順序排列。
如果創建時指定了columns和index索引,則按照索引順序排列,並且如果傳入的列在數據中找不到,就會在結果中產生缺失值:
數據索引 :Series和DataFrame的索引是Index類型,Index對象是不可修改,可通過索引值或索引標簽獲取目標數據,也可通過索引使序列或數據框的計算、操作實現自動化對齊。索引類型index的常用方法:
重新索引 :能夠改變、重排Series和DataFrame索引,會創建一個新對象,如果某個索引值當前不存在,就引入缺失值。
df.reindex(index, columns ,fill_value, method, limit, ) :index/columns為新的行列自定義索引;fill_value為用於填充缺失位置的值;method為填充方法,ffill當前值向前填充,bfill向後填充;limit為最大填充量; 默認True,生成新的對象,False時,新舊相等不復制。
刪除指定索引 :默認返回的是一個新對象。
.drop() :能夠刪除Series和DataFrame指定行或列索引。
刪除一行或者一列時,用單引號指定索引,刪除多行時用列表指定索引。
如果刪除的是列索引,需要增加axis=1或axis='columns'作為參數。
增加inplace=True作為參數,可以就地修改對象,不會返回新的對象。
在pandas中,有多個方法可以選取和重新組合數據。對於DataFrame,表5-4進行了總結
適用於Series和DataFrame的基本統計分析函數 :傳入axis='columns'或axis=1將會按行進行運算。
.describe() :針對各列的多個統計匯總,用統計學指標快速描述數據的概要。
.sum() :計算各列數據的和
.count() :非NaN值的數量
.mean( )/.median() :計算數據的算術平均值、算術中位數
.var()/.std() :計算數據的方差、標准差
.corr()/.cov() :計算相關系數矩陣、協方差矩陣,是通過參數對計算出來的。Series的corr方法用於計算兩個Series中重疊的、非NA的、按索引對齊的值的相關系數。DataFrame的corr和cov方法將以DataFrame的形式分別返回完整的相關系數或協方差矩陣。
.corrwith() :利用DataFrame的corrwith方法,可以計算其列或行跟另一個Series或DataFrame之間的相關系數。傳入一個Series將會返回一個相關系數值Series(針對各列進行計算),傳入一個DataFrame則會計算按列名配對的相關系數。
.min()/.max() :計算數據的最小值、最大值
.diff() :計算一階差分,對時間序列很有效
.mode() :計算眾數,返回頻數最高的那(幾)個
.mean() :計算均值
.quantile() :計算分位數(0到1)
.isin() :用於判斷矢量化集合的成員資格,可用於過濾Series中或DataFrame列中數據的子集
適用於Series的基本統計分析函數,DataFrame[列名]返回的是一個Series類型。
.unique() :返回一個Series中的唯一值組成的數組。
.value_counts() :計算一個Series中各值出現的頻率。
.argmin()/.argmax() :計算數據最大值、最小值所在位置的索引位置(自動索引)
.idxmin()/.idxmax() :計算數據最大值、最小值所在位置的索引(自定義索引)
pandas提供了一些用於將表格型數據讀取為DataFrame對象的函數。下表對它們進行了總結,其中read_csv()、read_table()、to_csv()是用得最多的。
在數據分析和建模的過程中,相當多的時間要用在數據准備上:載入、清理、轉換以及重塑。
在許多數據分析工作中,缺失數據是經常發生的。對於數值數據,pandas使用浮點值NaN(np.nan)表示缺失數據,也可將缺失值表示為NA(Python內置的None值)。
替換值
.replace(old, new) :用新的數據替換老的數據,如果希望一次性替換多個值,old和new可以是列表。默認會返回一個新的對象,傳入inplace=True可以對現有對象進行就地修改。
刪除重復數據
利用函數或字典進行數據轉換
df.head():查詢數據的前五行
df.tail():查詢數據的末尾5行
pandas.cut()
pandas.qcut() 基於分位數的離散化函數。基於秩或基於樣本分位數將變數離散化為等大小桶。
pandas.date_range() 返回一個時間索引
df.apply() 沿相應軸應用函數
Series.value_counts() 返回不同數據的計數值
df.aggregate()
df.reset_index() 重新設置index,參數drop = True時會丟棄原來的索引,設置新的從0開始的索引。常與groupby()一起用
numpy.zeros()
2. 2020年浙江省高校計算機二級Python考試大綱
2020年浙江省高校計算機二級Python考試大綱
考試目標
Python語言是一種解釋運行、面向對象、擴展性強的程序設計語言,是大學生掌握計算機編程能力、理解計算機解決問題方法的有效工具。學生通過對該語言程序設計的學習,應能掌握Python語言的基本語法和基本編程方法,理解程序設計中的計算思維,並能上機調試運行,解決實際問題。
基本要求
1.熟練掌握Python開發環境;掌握轉變程序為可執行文件的方法。
2.熟練掌握Python基本語法。
3.具備Python程序的設計、閱讀和分析能力。
4.掌握資料庫相關知識。
5. 掌握Python標准庫的使用方法,了解Python第三方庫的獲取、安裝和使用方法。
考試內容
一、Python基本語法
1.語法元素:程序格式、縮進、注釋、標識符(名稱)、常量、變數、函數、表達式、保留字、數據類型、賦值語句、模塊。
2.基本輸入輸出函數:input()、eval()、print()。
3.Python程序書寫風格:Python代碼規范、常用書寫風格。
4.Python的特點:Python的優點和缺點。
二、基本數據類型
1.數字類型:整數類型、浮點數(實數)類型和復數類型。
2.數字類型運算:數值運算操作符、數值運算函數。
3.字元串類型:索引、分片、基本format()格式化方法。
4.字元串類型的操作:字元串操作符、處理函數和處理方法。
5.常量和變數:變數的定義、賦值和使用。
6.系統函數和表達式:常用系統函數;運算符、優先順序、運算規則。
7.類型判斷和類型轉換:類型判斷函數、類型轉換函數。
三、程序控制結構
1.程序的3種控制結構:順序、分支、循環結構。
2.選擇結構:單分支結構、二分支結構、多分支結構。
3.循環結構:遍歷循環、無限循環、pass、break和continue。
4.異常處理:try … except。
四、用戶函數、模塊和代碼復用
1.函數的定義。創建函數;形參(形式參數)。
2.參數傳遞:可選參數傳遞、參數名稱傳遞、函數的返回值。
3.函數的調用。遞歸調用,實參(實際參數)。
4.變數作用域:局部變數和全局變數;本地變數和外部變數。
5.模塊及其使用:模塊的定義、創建和使用。
五、組合數據類型
1.列表:列表的定義、操作函數和操作方法。
2.元組(可選):元組的定義、操作函數和操作方法。
3.集合(可選):集合的定義、操作函數和操作方法。
4.字典類型:字典定義、鍵值對、操作函數和操作方法。
六、文件和數據格式化
1.文件的使用:文本和二進制文件的打開、讀寫、追加和關閉。
2.數據組織的維度:一維數據和二維數據。
3.一維和二維數據的處理:表示、存儲和處理。
4.採用CSV格式對一二維數據文件的讀寫:CSV格式的使用。
七、對象與方法
1.基本概念:類、對象、屬性、事件、方法、面向對象設計OOP。
2.OOP的特點:類和對象的封裝性、繼承性和多態性等。
3.類和對象:類和對象的創建和使用。
4.事件和方法:事件和方法的設計、實現和調用方法。
八、資料庫
1.資料庫基本概念:數據Data、表Table、資料庫DB、資料庫管理系統DBMS、資料庫系統DBS。
2.資料庫和表:表結構設計、創建資料庫、創建表、刪除表。
3.記錄的編輯和查詢:插入、修改、刪除、查詢、游標。
九、Python計算生態
1.標准庫:tkinter 庫、turtle庫、random庫。
2.第三方庫的獲取和安裝方法:了解第三方庫的使用方法。
以上就是小編整理的2020年浙江省高校計算機二級Python考試大綱,准備參加二級考試的同學們都來了解一下吧。想要及時了解考試動態的小夥伴可“ 免費預約簡訊提醒”屆時環球青藤會及時為大家推送全國計算機等級考試相關信息提醒。環球青藤友情提示:對於想要參加計算機二級考試的小夥伴們,環球青藤特地為您准備了計算機二級考試資料,如有需要請點擊文章下方“免費下載>>>計算機二級考試資料”下載學習。
3. python tablewidget怎麼自定義行距
例如上面效果的製作方法: 1、插入一個4列若干行的表格; 2、選中第一行,單擊表格工具布局---->合並單元格按鈕,將其變為一個單元格,並輸入成績表,設置為居中; 3、在第二行輸入相應標題行內容; 4、選中第一行,單擊頁面布局---->頁面邊框按...
4. 怎樣使用Python圖像處理
Python圖像處理是一種簡單易學,功能強大的解釋型編程語言,它有簡潔明了的語法,高效率的高層數據結構,能夠簡單而有效地實現面向對象編程,下文進行對Python圖像處理進行說明。
當然,首先要感謝「戀花蝶」,是他的文章「用Python圖像處理 」 幫我堅定了用Python和PIL解決問題的想法,對於PIL的一些介紹和基本操作,可以看看這篇文章。我這里主要是介紹點我在使用過程中的經驗。
PIL可以對圖像的顏色進行轉換,並支持諸如24位彩色、8位灰度圖和二值圖等模式,簡單的轉換可以通過Image.convert(mode)函數完 成,其中mode表示輸出的顏色模式。例如''L''表示灰度,''1''表示二值圖模式等。
但是利用convert函數將灰度圖轉換為二值圖時,是採用固定的閾 值127來實現的,即灰度高於127的像素值為1,而灰度低於127的像素值為0。為了能夠通過自定義的閾值實現灰度圖到二值圖的轉換,就要用到 Image.point函數。
深度剖析Python語法功能
深度說明Python應用程序特點
對Python資料庫進行學習研究
Python開發人員對Python經驗之談
對Python動態類型語言解析
Image.point函數有多種形式,這里只討論Image.point(table, mode),利用該函數可以通過查表的方式實現像素顏色的模式轉換。其中table為顏色轉換過程中的映射表,每個顏色通道應當有256個元素,而 mode表示所輸出的顏色模式,同樣的,''L''表示灰度,''1''表示二值圖模式。
可見,轉換過程的關鍵在於設計映射表,如果只是需要一個簡單的箝位值,可以將table中高於或低於箝位值的元素分別設為1與0。當然,由於這里的table並沒有什麼特殊要求,所以可以通過對元素的特殊設定實現(0, 255)范圍內,任意需要的一對一映射關系。
示例代碼如下:
import Image # load a color image im = Image.open(''fun.jpg'') # convert to grey level image Lim = im.convert(''L'') Lim.save(''fun_Level.jpg'') # setup a converting table with constant threshold threshold = 80 table = [] for i in range(256): if i < threshold: table.append(0) else: table.append(1) # convert to binary image by the table bim = Lim.point(table, ''1'') bim.save(''fun_binary.jpg'')
IT部分通常要完成的任務相當繁重但支撐這些工作的資源卻很少,這已經成為公開的秘密。任何承諾提高編碼效率、降低軟體總成本的IT解決方案都應該進行 周到的考慮。Python圖像處理所具有的一個顯著優勢就是可以在企業的軟體創建和維護階段節約大量資金,而這兩個階段的軟體成本佔到了軟體整個生命周期中總成本 的50%到95%。
Python清晰可讀的語法使得軟體代碼具有異乎尋常的易讀性,甚至對那些不是最初接觸和開發原始項目的程序員都 能具有這樣的強烈感覺。雖然某些程序員反對在Python代碼中大量使用空格。
不過,幾乎人人都承認Python圖像處理的可讀性遠勝於C或者Java,後兩 者都採用了專門的字元標記代碼塊結構、循環、函數以及其他編程結構的開始和結束。提倡Python的人還宣稱,採用這些字元可能會產生顯著的編程風格差 異,使得那些負責維護代碼的人遭遇代碼可讀性方面的困難。轉載