⑴ 2017年10大流行python庫有哪些
1、NumPy
NumPy是構建科學計算 stack 的最基礎的包。它為 Python 中的 n 維數組和矩陣的操作提供了大量有用的功能。該庫還提供了 NumPy 數組類型的數學運算向量化,可以提升性能,從而加快執行速度。
2、SciPy
SciPy 是一個工程和科學軟體庫, 包含線性代數、優化、集成和統計的模塊。SciPy 庫的主
要功能建立在 NumPy 的基礎之上,它通過其特定的子模塊提供高效的數值常式操作。SciPy 的所有子模塊中的函數都有詳細的文檔,這也是一個優勢。
3、Pandas
Pandas是一個 Python 包,旨在通過「標記(labeled)」和「關系(relational)」數據進行工作,簡單直觀。Pandas 是 data wrangling 的完美工具。它設計用於快速簡單的數據操作、聚合和可視化。
4、Seaborn
Seaborn 主要關注統計模型的可視化;這種可視化包括熱度圖(heat map),可以總結數據但也描繪總體分布。Seaborn 基於 Matplotlib,並高度依賴於它。
5、Bokeh
Bokeh是一個很好的可視化庫,其目的是互動式可視化,不過這個庫獨立於 Matplotlib,它通過現代瀏覽器以數據驅動文檔(D3.js)的風格呈現。
6、Scikits
Scikits 是 SciPy Stack 的附加軟體包,專為特定功能(如圖像處理和輔助機器學習)而設計。其中最突出的一個是 scikit-learn。該軟體包構建於 SciPy 之上,並大量使用其數學操作,是使用 Python 進行機器學習的實際上的行業標准。
7、Theano
Theano 是一個 Python 包,它定義了與 NumPy 類似的多維數組,以及數學運算和表達式。該庫是經過編譯的,使其在所有架構上能夠高效運行。這個庫最初由蒙特利爾大學機器學習組開發,主要是為了滿足機器學習的需求。
8、Keras
Keras是一個使用高層介面構建神經網路的開源庫,它是用 Python 編寫的。它簡單易懂,具有高級可擴展性。Keras 極其容易上手,而且可以進行快速的原型設計,足以用於嚴肅的建模。
9、Gensim
Gensim是一個用於 Python 的開源庫,實現了用於向量空間建模和主題建模的工具。Gensim 實現了諸如分層 Dirichlet 進程(HDP)、潛在語義分析(LSA)和潛在 Dirichlet 分配(LDA)等演算法,還有 tf-idf、隨機投影、word2vec 和 document2vec,以便於檢查一組文檔(通常稱為語料庫)中文本的重復模式。
10、Scrapy
Scrapy 是用於從網路檢索結構化數據的爬蟲程序的庫。它現在已經發展成了一個完整的框架,可以從 API 收集數據,也可以用作通用的爬蟲。該庫在介面設計上遵循著名的 Don』t Repeat Yourself 原則——提醒用戶編寫通用的可復用的代碼,因此可以用來開發和擴展大型爬蟲。
⑵ python中是否有用於計算兩個字元串相似度的函數
linux環境下,沒有首先安裝python_Levenshtein,用法如下:
重點介紹幾個該包中的幾個計算字串相似度的幾個函數實現。
1. Levenshtein.hamming(str1, str2)
計算漢明距離。要求str1和str2必須長度一致。是描述兩個等長字串之間對應位置上不同字元的個數。如
2. Levenshtein.distance(str1, str2)
計算編輯距離(也成Levenshtein距離)。是描述由一個字串轉化成另一個字串最少的操作次數,在其中的操作包括插入、刪除、替換。如
演算法實現 參考動態規劃整理:http://www.cnblogs.com/kaituorensheng/archive/2013/05/15/3080990.html。
3. Levenshtein.ratio(str1, str2)
計算萊文斯坦比。計算公式 r = (sum - ldist) / sum, 其中sum是指str1 和 str2 字串的長度總和,ldist是類編輯距離
注意:這里的類編輯距離不是2中所說的編輯距離,2中三種操作中每個操作+1,而在此處,刪除、插入依然+1,但是替換+2
這樣設計的目的:ratio('a', 'c'),sum=2,按2中計算為(2-1)/2 = 0.5,』a','c'沒有重合,顯然不合算,但是替換操作+2,就可以解決這個問題。
4. Levenshtein.jaro(s1, s2)
計算jaro距離,
其中的m為s1, s2的匹配長度,當某位置的認為匹配 當該位置字元相同,或者在不超過
t是調換次數的一半
5. Levenshtein.jaro_winkler(s1, s2)
計算Jaro–Winkler距離
⑶ python基礎教程 10-11例子如何執行
2020年最新Python零基礎教程(高清視頻)網路網盤
鏈接:
若資源有問題歡迎追問~