導航:首頁 > 編程語言 > python詞典哈希

python詞典哈希

發布時間:2025-03-18 00:00:28

python dict 實現原理 2019-04-17

dict對象是Python中一個原始的數據類型,按照鍵值對的方式存儲,中文名為字典,其通過鍵名查找對應的值有很高的效率,時間復雜度在常數級別O(1)。Python dict的底層是依靠哈希表(Hash Table)進行實現的,使用開放地址法解決沖突。所以其查找的時間復雜度會是O(1),why?

哈希表是key-value類型的數據結構,通過關鍵碼值直接進行訪問。通過散列函數進行鍵和數組的下標映射從而決定該鍵值應該放在哪個位置,哈希表可以理解為一個鍵值需要按一定規則存放的數組,而哈希函數就是這個規則。

演算法中時間和空間是不能兼得的,哈希表就是一種用合理的時間消耗去減少大量空間消耗的操作,這取決於具體的功能要求。

創建一個數組,數組下標是索引號,數組中的值是要獲得的數據,這樣只需要O(1)的時間復雜度就可以完成操作,但是擴展性不強,有以下兩個方面的考慮:
-1- 新添加的元素超出數組索引范圍,這就需要重新申請數組進行遷移操作。
-2- 假設一種極端的情況:只存在兩個元素,索引號分別是1和100000000001,按照先前的設計思路,會浪費很大的存儲空間。
會不會存在一個方法,為已有的索引創建新的索引,通過壓縮位數,讓新索引可以和原有的大范圍的稀疏索引進行一一對應,新索引所需要的存儲空間要大大減小,這就是哈希思想。

上面的例子中哈希函數的設計很隨意,但是從這個例子中我們也可以得到信息:
哈希函數就是一個映射,因此哈希函數的設定很靈活,只要使得任何關鍵字由此所得的哈希函數值都落在表長允許的范圍之內即可;
因為新的索引對舊的索引進行了空間上的壓縮,所以不可能所有的輸入都只對應唯一一個輸出,也就是哈希函數式有可能發生沖突的,哈希函數不可能做成一對一的映射關系,其本質是一個多對一的映射。

直接定址法:很容易理解,key=Value+C; 這個「C」是常量。Value+C其實就是一個簡單的哈希函數。
除法取余法: 很容易理解, key=value%C;解釋同上。
數字分析法:這種蠻有意思,比如有一組value1=112233,value2=112633,value3=119033,針對這樣的數我們分析數中間兩個數比較波動,其他數不變。那麼我們取key的值就可以是key1=22,key2=26,key3=90。
平方取中法。此處忽略,見名識意。
折疊法:這種蠻有意思,比如value=135790,要求key是2位數的散列值。那麼我們將value變為13+57+90=160,然後去掉高位「1」,此時key=60,哈哈,這就是他們的哈希關系,這樣做的目的就是key與每一位value都相關,來做到「散列地址」盡可能分散的目地。

當兩個不同的數據元素的哈希值相同時,就會發生沖突。解決沖突常用的手法有2種:
開放地址法:
如果兩個數據元素的哈希值相同,則在哈希表中為後插入的數據元素另外選擇一個表項。當程序查找哈希表時,如果沒有在第一個對應的哈希表項中找到符合查找要求的數據元素,程序就會繼續往後查找,直到找到一個符合查找要求的數據元素,或者遇到一個空的表項。
鏈接法:
將哈希值相同的數據元素存放在一個鏈表中,在查找哈希表的過程中,當查找到這個鏈表時,必須採用線性查找方法。

python的dict採用了哈希表,最低能在 O(1)時間內完成搜索,在發生哈希沖突的時候採用的是開放定址法。java的HashMap也是採用了哈希表實現,但是在發生哈希沖突的時候採用的是鏈接法。

閱讀全文

與python詞典哈希相關的資料

熱點內容
地磅儀表盤加密方法 瀏覽:480
brew安裝php環境 瀏覽:829
電腦版釘釘如何加密 瀏覽:709
android動畫結合 瀏覽:925
androidfb0 瀏覽:579
我的世界怎麼給伺服器稱號 瀏覽:462
編譯器怎麼寫簡單 瀏覽:151
windows7如何連接伺服器 瀏覽:23
部隊開進命令怎麼下達 瀏覽:768
linux安裝mingw 瀏覽:55
寶武app工資待遇怎麼樣 瀏覽:249
gradle編譯速度很慢 瀏覽:916
500人視頻學慣用什麼伺服器好 瀏覽:340
三菱plc讀出來的程式編譯不了 瀏覽:411
rockey4加密狗復制下載 瀏覽:365
農商銀行app怎麼裝不上 瀏覽:826
先解壓後拿綠本還是先拿綠本 瀏覽:366
計量經濟分析格林pdf 瀏覽:654
什麼app摳圖好用免費的 瀏覽:281
文電通pdfgold 瀏覽:853