『壹』 數據壓縮的基本原理
數據壓縮的基本原理
--------------------------------------------------------------------------------
數據壓縮技術就是對原始數據進行數據編碼或壓縮編碼。
目前常用的壓縮編碼有:冗餘壓縮法(無損壓縮法、熵編碼)和熵壓縮法(有損壓縮法)兩類。
無損壓縮是可逆的;有損壓縮是不可逆的。
--------------------------------------------------------------------------------
變長編碼
使用長度可變的代碼來對以不同頻率出現的樣本進行編碼。
1·Huffman編碼
Huffman編碼又稱最佳編碼。
Huffman編碼過程是:
*將信源符號按概率遞減順序排列;
*把兩個最小的概率加起來,作為新符號的概率;
*重復上述兩步驟,直到概率的和達到1為止;
*在每次合並消息時,將被合並的消息賦予1和0或賦予0和1;
*尋找從每一信源符號到概率為1的路經,記錄下路經上的1和0;
*對每一符號寫出從碼樹的根到終結點1、0序列。
例:對信源
[X1,X2,X3,X4,X5,X6]=[0.25,0.25,0.20,0.15,0.10,0.05]
進行Huffman編碼。
其中:X1=01;X2=10;X3=11;X4=000;X5=0010;X6=0011。
2·算術編碼
算術編碼是一種二元編碼。
這種編碼方法是在不考慮信源統計的情況下,只要監視一小段時間內碼字出現的頻率,不管統計是平穩的或非平穩的,編碼的碼率總能趨近於信源熵值,每次迭代的編碼演算法只處理一個數據符號,並且只有算術運算。
對二進制編碼來說,信源符號只有兩個。在算術編碼的初級階段,可設一個大概率Pe和小概率Qe,然後對被編碼比特流符號進行判斷。
其步驟:
*設編碼初始化子區間為[0,1],Qe從0算起,則Pe=1-Qe。
*確定子區間起始位置:子區間起始位置=前子區間的長度+ 當前符號的區間左端X前子區間長度
*確定新子區間長度:新子區間長度=前子區間的長度X當前符號的概率
*隨著被編碼數據流符號的輸入,子區間逐漸縮小,
*最後得到的子區間長度決定了表示該區域內的某一個數所需的位數。
例:P42
--------------------------------------------------------------------------------
預測編碼
(自習)
--------------------------------------------------------------------------------
變換編碼
變換編碼是指對信號進行變換後在編碼。
例如:
典型的編碼結構是:
--------------------------------------------------------------------------------
模型編碼
模型編碼是指採用模型的方法對傳輸的圖像進行參數估測。
模型編碼有:隨機馬爾可夫場和分形圖像編碼。
1·分形的概念
分形的含義是其組成部分以某種方式與整體相似的形(一類無規則、混亂而復雜),其局部與整體有相似性的體系,即:自相似性體系。
2·分形編碼
*基本原理:分形的方法是把一幅數字圖像,通過一些圖像處理技術將原始圖像分成一些子圖像,然後在分形集中查找這樣的子圖像。分形集存儲許多迭代函數,通過迭代函數的反復迭代,可以恢復原來的子圖像。
分形編碼壓縮的步驟:
第一步:把圖像劃分為互不重疊的、任意大小的的D分區;
第二步:劃定一些可以相互重疊的、比D分區大的R分區;
第三步:為每個D分區選定仿射變換表。
分形編碼解壓步驟:
首先從文件中讀取D分區劃分方式的信息和仿射變換系數等數據;
然後劃定兩個同樣大小的緩沖區給D圖像和R圖像,並把R初始化到任一初始階段;
根據仿射變換系數把其相應的R分區做仿射變換,並用變換後的數據取代該D分區的原有數據;
對D中所有的D分區都進行上述操作,全部完成後就形成一個新的D圖像;
再把新D圖像的內容拷貝到R中,把新R當作D,D當作R,重復操作(迭代)。
。分形編碼的特點:
壓縮比高,壓縮後的文件容量與圖像像素數無關,在壓縮時時間長但解壓縮速度快。
--------------------------------------------------------------------------------
『貳』 數據壓縮方法有幾種
實現數據壓縮技術方法有兩種:一是在信源編碼過程中進行壓縮,IEEE的MPEG專家組已發展制訂了ISO/IEC13818(MPEG-2)國際標准,MPEG-2採用不同的層和級組合即可滿足從家庭質量到廣播級質量以及將要播出的高清晰度電視質量不同的要求,其應用面很廣,它支持標准解析度16:9寬屏及高清晰度電視等多種格式,從進入家庭的DVD到衛星電視、廣播電視微波傳輸都採用了這一標准。二是改進信道編碼,發展新的數字調制技術,提高單位頻寬數據傳送速率。如,在歐洲DVB數字電視系統中,數字衛星電視系統(DVB-S)採用正交相移鍵控調制(OPSK);數字有線電視系統(DVB-C)採用正交調幅調制(QAM);數字地面開路電視系統就(DVB-T)採用更為復雜的編碼正交頻分復用調制(COFDM)。
『叄』 數據壓縮分為哪三類
數據壓縮分為兩類,有三種分法:
1、即時壓縮和非即時壓縮
即時壓縮是將語音信號轉化為數字信號,同時進行壓縮,然後即時通過Internet傳送出去。即時壓縮一般應用在影像、聲音數據的傳送中。
非即時壓縮是在需要的情況下才進行,沒有即時性。非即時壓縮一般不需要專門的設備,直接在計算機中安裝並使用相應的壓縮軟體即可。
2、數字壓縮和文件壓縮
數字壓縮是專指一些具有時間性的數據,這些數據常常是即時採集、即時處理或傳輸的。
文件壓縮是專指對將要保存在磁碟等物理介質的數據進行壓縮,如一篇文章數據、一段音樂數據、一段程序編碼數據等的壓縮。
3、無損壓縮與有損壓縮
無損壓縮利用數據的統計冗餘進行壓縮,所以無損壓縮的壓縮比一般比較低。這類方法廣泛應用於文本數據、程序和特殊應用場合的圖像數據等需要精確存儲數據的壓縮。
有損壓縮方法利用了人類視覺、聽覺對圖像、聲音中的某些頻率成分不敏感的特性,允許壓縮的過程中損失一定的信息。有損壓縮廣泛應用於語音、圖像和視頻數據的壓縮。
(3)數據壓縮擴展閱讀:
無損壓縮格式可以很方便地還原成WAV,還能直接轉壓縮成MP3、Ogg等有損壓縮格式,甚至可以在不同無損壓縮格式之間互相轉換,而不會丟失任何數據。
這一點比起有損格式要強。因為有損壓縮格式的二次編碼(從一種有損格式轉換成另一種有損格式,或者格式不變而調整比特率)意味著丟失更多的信號,帶來更大的失真。
參考資料來源:
網路——數據壓縮
網路——無損壓縮
『肆』 數據壓縮的方法
數據壓縮的方式和文檔壓縮圖片壓縮都一樣,你需要用壓縮軟體
『伍』 數據壓縮
數據壓縮技術主要研究數據的表示、傳輸和轉換方法,目的是減少數據所佔據的存儲空間和縮短數據傳輸時所需要的時間。
衡量數據壓縮的3個主要指標:一是壓縮前後所需的信息存儲量之比要大;二是實現壓縮的演算法要簡單,壓縮、解壓縮速度快,要盡可能做到實時壓縮和解壓縮;三是恢復效果要好,要盡可能完全恢復原始數據。
數據壓縮主要應用於兩個方面。一是傳輸:通過壓縮發送端的原始數據,並在接收端進行解壓恢復,可以有效地減少傳輸時間和增加信道帶寬。二是存儲:在存儲時壓縮原始數據,在使用時進行解壓,可大大提高存儲介質的存儲量。
數據壓縮按照壓縮的失真度分成兩種類型:一種叫作無損壓縮,另一種叫作有損壓縮。
無損壓縮是指使用壓縮後的數據進行重構(或者叫作還原、解壓縮),重構後的數據與原來的數據完全相同;無損壓縮用於要求重構的信號與原始信號完全一致的場合。一個很常見的例子是磁碟文件的壓縮。根據目前的技術水平,無損壓縮演算法一般可以把普通文件的數據壓縮到原來的1/4~1/2。一些常用的無損壓縮演算法有霍夫曼(Huffman)演算法、算術演算法、遊程演算法和LZW(Lenpel-Ziv & Welch)壓縮演算法。
1)霍夫曼演算法屬於統計式壓縮方法,其原理是根據原始數據符號發生的概率進行編碼。在原始數據中出現概率越高的符合,相應的碼長越短,出現概率越少的符合,其碼長越長。從而達到用盡可能少的符號來表示原始數據,實現對數據的壓縮。
2)算術演算法是基於統計原理,無損壓縮效率最高的演算法。即將整段要壓縮的數據映射到一段實數半封閉的范圍[0,1)內的某一區段。該區段的范圍或寬度等於該段信息概率。即是所有使用在該信息內的符號出現概率全部相乘後的概率值。當要被編碼的信息越來越長時,用來代表該信息的區段就會越來越窄,用來表示這個區段的位就會增加。
3)遊程演算法是針對一些文本數據特點所設計的壓縮方法。主要是去除文本中的冗餘字元或位元組中的冗餘位,從而達到減少數據文件所佔的存儲空間。壓縮處理流程類似於空白壓縮,區別是在壓縮指示字元之後加上一個字元,用於表明壓縮對象,隨後是該字元的重復次數。本演算法具有局限性,很少單獨使用,多與其他演算法配合使用。
4)LZW演算法的原理是用字典詞條的編碼代替在壓縮數據中的字元串。因此字典中的詞條越多,壓縮率越高,加大字典的容量可以提高壓縮率。字典的容量受計算機的內存限制。
有損壓縮是指使用壓縮後的數據進行重構,重構後的數據與原來的數據有所不同,但不影響人對原始資料表達的信息造成誤解。有損壓縮適用於重構信號不一定非要和原始信號完全相同的場合。例如,圖像和聲音的壓縮就可以採用有損壓縮,因為其中包含的數據往往多於我們的視覺系統和聽覺系統所能接收的信息,丟掉一些數據而不至於對聲音或者圖像所表達的意思產生誤解,但可大大提高壓縮比。
『陸』 什麼是數據壓縮
數據壓縮是指在不丟失信息的前提下,縮減數據量以減少存儲空間,提高其傳輸、存儲和處理效率的一種技術方法。或按照一定的演算法對數據進行重新組織,減少數據的冗餘和存儲的空間。數據壓縮包括有損壓縮和無損壓縮。
『柒』 數據壓縮的方法
這方面技術現在還沒有突破,各種演算法差異不大:我一般都用7Z 感覺還不錯
WAV/PCM的音頻格式,用rar壓縮率比7z高很多,而bmp/點陣圖的則是7z要高些。
7-Zip 主要特徵
使用了 LZMA 與 LZMA2 演算法的 7z 格式 擁有極高的壓縮比
支持格式:
壓縮 / 解壓縮:7z, XZ, BZIP2, GZIP, TAR, ZIP and WIM
僅
解壓縮:ARJ, CAB, CHM, CPIO, CramFS, DEB, DMG, FAT, HFS, ISO, LZH, LZMA,
MBR, MSI, NSIS, NTFS, RAR, RPM, SquashFS, UDF, VHD, WIM, XAR, Z
對於 ZIP 及 GZIP 格式,7-Zip 能提供比使用 PKZip 及 WinZip 高 2-10% 的壓縮比
為 7z 與 ZIP 提供更完善的 AES-256 加密演算法
7z 格式支持創建自釋放壓縮包
Windows 資源管理器集成
強大的的文件管理器
更給力的命令行版本
支持 FAR Manager 插件
『捌』 數據壓縮的必要性
必要性:多媒體數據的顯著特點就是數據量非常大。例如,一張彩色相片的數據量可達10mb;視頻影像和聲音由於連續播放,數據量更加龐大。這對計算機的存儲以及網路傳輸都造成了極大的負擔。
『玖』 數據壓縮的定義
數據壓縮是指在不丟失有用信息的前提下,縮減數據量以減少存儲空間,提高其傳輸、存儲和處理效率,或按照一定的演算法對數據進行重新組織,減少數據的冗餘和存儲的空間的一種技術方法。數據壓縮包括有損壓縮和無損壓縮。
『拾』 數據壓縮基本原理
無損壓縮基本上有2種:
字典式。用之前出現過的消息來替換從,比如:「我非常非常非常喜歡你」,可以壓縮為「我非常x3喜歡你」
統計式,用短的替換頻繁出現的。比如,哈夫曼壓縮演算法。
上面只是大概的描述,如果想深入還是找本演算法書看看吧。