數據壓縮論文_多媒體數據壓縮算術研究論文筆記

『壹』用pca演算法可以寫一篇小論文嗎

不可以。該演算法的主要作用為：
1、數據壓縮；
2、數據預處理；
3、圖象、語音、通信的分析處理
4、降維(最主要)，去除數據冗餘與雜訊
5、高維數據集的探索與可視化。

『貳』投稿論文文件過大,可以壓縮嗎

投稿論文文件過大不可以壓縮。

壓縮文件的基本原理是查找文件內的重復位元組並建立一個相同位元組的詞典文件，並用一個代碼表示比如在文件里有幾處有一個相同的詞中華人民共和國用一個代碼表示並寫入詞典文件這樣就可以達到縮小文件的目的。

壓縮機制簡介

重復為單位元組的重復一個位元組只有二百五十六種可能的取值所以這種重復是必然的其中某些位元組出現次數可能較多，另一些則較少在統計上有分布不均勻的傾向這是容易理解的某些符號可能很少用到而字母和數字則使用較多各字母的使用頻率也是不一樣的，壓縮機制是一種很方便的發明尤其是對網路用戶因為它可以減小文件中的比特和位元組總數，使文件能夠通過較慢的互聯網連接實現更快傳輸此外還可以減少文件的磁碟佔用空間。

『叄』多媒體數據壓縮算術研究論文筆記

多媒體圖像壓縮技術
姓名:Vencent Lee
摘要：多媒體數據壓縮技術是現代網路發展的關鍵性技術之一。由於圖像和聲音信號中存在各種各樣的冗餘，為數據壓縮提供了可能。數據壓縮技術有無損壓和有損壓縮兩大類，這些壓縮技術又各有不同的標准。
一、多媒體數據壓縮技術
仙農(C．E．Shannon)在創立資訊理論時，提出把數據看作是信息和冗餘度的組合。早期的數據壓縮之所以成為資訊理論的一部分是因為它涉及冗餘度問題。而數據之所以能夠被壓縮是因為其中存在各種各樣的冗餘；其中有時間冗餘性、空間冗餘性、信息熵冗餘、先驗知識冗餘、其它冗餘等。時間冗餘是語音和序列圖像中常見的冗餘，運動圖像中前後兩幀間就存在很強的相關性，利用幀間運動補興就可以將圖像數據的速率大大壓縮。語音也是這樣。尤其是濁音段，在相當長的時間內(幾到幾十毫秒)語音信號都表現出很強的周期性，可以利用線性預測的方法得到較高的壓縮比。空間冗餘是用來表示圖像數據中存在的某種空間上的規則性，如大面積的均勻背景中就有很大的空間冗餘性。信息熵冗餘是指在信源的符號表示過程中由於未遵循資訊理論意義下最優編碼而造成的冗餘性，這種冗餘性可以通過熵編碼來進行壓縮，經常使用的如Huff-man編碼。先驗知識冗餘是指數據的理解與先驗知識有相當大的關系，如當收信方知道一個單詞的前幾個字母為administrato時，立刻就可以猜到最後一個字母為r，那麼在這種情況下，最後一個字母就不帶任何信息量了，這就是一種先驗知識冗餘。其它冗餘是指那些主觀無法感受到的信息等帶來的冗餘。
通常數據壓縮技術可分為無損壓縮(又叫冗餘壓縮)和有損壓縮(又叫熵壓縮)兩大類。無損壓縮就是把數據中的冗餘去掉或減少，但這些冗餘量是可以重新插入到數據中的，因而不會產生失真。該方法一般用於文本數據的壓縮，它可以保證完全地恢復原始數據；其缺點是壓縮比小(其壓縮比一般為2：1至5：1)。有損壓縮是對熵進行壓縮，因而存在一定程度的失真；它主要用於對聲音、圖像、動態視頻等數據進行壓縮，壓縮比較高(其壓縮比一般高達20：1以上。最新被稱為「E—igen—ID」的壓縮技術可將基因數據壓縮1．5億倍)。對於多媒體圖像採用的有損壓縮的標准有靜態圖像壓縮標准(JPEG標准，即『JointPhotographicExpertGroup』標准)和動態圖像壓縮標准(MPEG標准，即『MovingPictureExpertGroup』標准)。
JPEG利用了人眼的心理和生理特徵及其局限性來對彩色的、單色的和多灰度連續色調的、靜態圖像的、數字圖像的壓縮，因此它非常適合不太復雜的以及一般來源於真
實景物的圖像。它定義了兩種基本的壓縮演算法：一種是基於有失真的壓縮演算法，另一種是基於空間線性預測技術(DPCM)無失真的壓縮演算法。為了滿足各種需要，它制定了四種工作模式：無失真壓縮、基於DCT的順序工作方式、累進工作方式和分層工作方式。
MPEG用於活動影像的壓縮。MPEG標准具體包三部分內容：(1)MPEG視頻、(2)MPEG音頻、(3)MP系統(視頻和音頻的同步)。MPEG視頻是標準的核心分，它採用了幀內和幀間相結合的壓縮方法，以離散余變換(DCT)和運動補償兩項技術為基礎，在圖像質量基不變的情況下，MPEG可把圖像壓縮至1／100或更MPEG音頻壓縮演算法則是根據人耳屏蔽濾波功能。利用音響心理學的基本原理，即「某些頻率的音響在重放其頻率的音頻時聽不到」這樣一個特性，將那些人耳完全不到或基本上聽到的多餘音頻信號壓縮掉，最後使音頻號的壓縮比達到8：1或更高，音質逼真，與CD唱片可媲美。按照MPEG標准，MPEG數據流包含系統層和壓層數據。系統層含有定時信號，圖像和聲音的同步、多
分配等信息。壓縮層包含經壓縮後的實際的圖像和聲數據，該數據流將視頻、音頻信號復合及同步後，其數據輸率為1．5MB／s。其中壓縮圖像數據傳輸率為1．2M壓縮聲音傳輸率為0．2MB／s。
MPEG標準的發展經歷了MPEG—I,MPEG一2、MPEG一4、MPEG-7、MPEG一21等不同層次。在MPEG的不同標准中，每—個標准都是建立在前面的標准之上的，並與前面的標准向後的兼容。目前在圖像壓縮中，應用得較多的是MPEG一4標准，MPEG-是在MPEG-2基礎上作了很大的擴充，主要目標是多媒體應用。在MPEG一2標准中，我們的觀念是單幅圖像，而且包含了一幅圖像的全部元素。在MPEG一4標准下，我們的觀念變為多圖像元素，其中的每—個多圖像元素都是獨立編碼處理的。該標准包含了為接收器所用的指令，告訴接收器如何構成最終的圖像。

上圖既表示了MPEG一4解碼器的概念，又比較清楚地描繪了每個部件的用途。這里不是使用單一的視頻或音頻解碼器，而是使用若干個解碼器，其中的每一個解碼器只接收某個特定的圖像(或聲音)元素，並完成解碼操作。每個解碼緩沖器只接收屬於它自己的靈敏據流，並轉送給解碼器。復合存儲器完成圖像元素的存儲，並將它們送到顯示器的恰當位置。音頻的情況也是這樣，但顯然不同點是要求同時提供所有的元素。數據上的時間標記保證這些元素在時間上能正確同步。MPEG一4標准對自然元素(實物圖像)和合成元素進行區分和規定，計算機生成的動畫是合成元素的一個例子。比如，一幅完整的圖像可以包含一幅實際的背景圖，並在前面有一幅動畫或者有另外一幅自然圖像。這樣的每一幅圖像都可以作最佳壓縮，並互相獨立地傳送到接收器，接收器知道如何把這些元素組合在一起。在MPEG一2標准中，圖像被看作一個整體來壓縮；而在MPEG一4標准下，對圖像中的每一個元素進行優化壓縮。靜止的背景不必壓縮到以後的I幀之中去，否則會使帶寬的使用變得很緊張。而如果這個背景圖像靜止10秒鍾，就只要傳送一次(假設我們不必擔心有人在該時間內切人此頻道)，需要不斷傳送的僅是前台的比較小的圖像元素。對有些節目類型，這樣做會節省大量的帶寬。MPEG一4標准對音頻的處理也是相同的。例如，有一位獨唱演員，伴隨有電子合成器，在MPEG一2標准下，我們必須先把獨唱和合成器作混合，然後再對合成的音頻信號進行壓縮與傳送。在MPEG一4標准下，我們可以對獨唱作單獨壓縮，然後再傳送樂器數字介面的聲軌信號，就可以使接收器重建伴音。當然，接收器必須能支持MIDI放音。與傳送合成的信號相比，分別傳送獨唱信號和MIDI數據要節省大量的帶寬。其它的節目類型同樣可以作類似的規定。MPEG一7標准又叫多媒體內容描述介面標准。圖像可以用色彩、紋理、形狀、運動等參數來描述，MPEG一7標準是依靠眾多的參數對圖像與聲音實現分類，並對它們的資料庫實現查詢。
二、多媒體數據壓縮技術的實現方法
目前多媒體壓縮技術的實現方法已有近百種，其中基於信源理論編碼的壓縮方法、離散餘弦變換(DCT)和小波分解技術壓縮演算法的研究更具有代表性。小波技術突破了傳統壓縮方法的局限性，引入了局部和全局相關去冗餘的新思想，具有較大的潛力，因此近幾年來吸引了眾多的研究者。在小波壓縮技術中，一幅圖像可以被分解為若干個叫做「小片」的區域；在每個小片中，圖像經濾波後被分解成若干個低頻與高頻分量。低頻分量可以用不同的解析度進行量化，即圖像的低頻部分需要許多的二進制位，以改善圖像重構時的信噪比。低頻元素採用精細量化，高頻分量可以量化得比較粗糙，因為你不太容易看到變化區域的雜訊與誤差。此外，碎片技術已經作為一種壓縮方法被提出，這種技術依靠實際圖形的重復特性。用碎片技術壓縮圖像時需要佔用大量的計算機資源，但可以獲得很好的結果。藉助於從DNA序列研究中發展出來的模式識別技術，能減少通過WAN鏈路的流量，最多時的壓縮比率能達到90％，從而為網路傳送圖像和聲音提供更大的壓縮比，減輕風絡負荷，更好地實現網路信息傳播。
三、壓縮原理
由於圖像數據之間存在著一定的冗餘，所以使得數據的壓縮成為可能。資訊理論的創始人Shannon提出把數據看作是信息和冗餘度（rendancy）的組合。所謂冗餘度，是由於一副圖像的各像素之間存在著很大的相關性，可利用一些編碼的方法刪去它們，從而達到減少冗餘壓縮數據的目的。為了去掉數據中的冗餘，常常要考慮信號源的統計特性，或建立信號源的統計模型。圖像的冗餘包括以下幾種：
(1) 空間冗餘：像素點之間的相關性。
(2) 時間冗餘：活動圖像的兩個連續幀之間的冗餘。
(3) 信息熵冗餘：單位信息量大於其熵。
(4) 結構冗餘：圖像的區域上存在非常強的紋理結構。
(5) 知識冗餘：有固定的結構，如人的頭像。
(6) 視覺冗餘：某些圖像的失真是人眼不易覺察的。
對數字圖像進行壓縮通常利用兩個基本原理：
(1) 數字圖像的相關性。在圖像的同一行相鄰像素之間、活動圖像的相鄰幀的對應像素之間往往存在很強的相關性，去除或減少這些相關性，也就去除或減少圖像信息中的冗餘度，即實現了對數字圖像的壓縮。
(2) 人的視覺心理特徵。人的視覺對於邊緣急劇變化不敏感(視覺掩蓋效應)，對顏色分辨力弱，利用這些特徵可以在相應部分適當降低編碼精度，而使人從視覺上並不感覺到圖像質量的下降，從而達到對數字圖像壓縮的目的。
編碼壓縮方法有許多種，從不同的角度出發有不同的分類方法，比如從資訊理論角度出發可分為兩大類：
(1)冗餘度壓縮方法，也稱無損壓縮，信息保持編碼或熵編碼。具體講就是解碼圖像和壓縮編碼前的圖像嚴格相同，沒有失真，從數學上講是一種可逆運算。
(2)信息量壓縮方法，也稱有損壓縮，失真度編碼或熵壓縮編碼。也就是講解碼圖像和原始圖像是有差別的，允許有一定的失真。
應用在多媒體中的圖像壓縮編碼方法，從壓縮編碼演算法原理上可以分類為：
(1)無損壓縮編碼種類 •哈夫曼編碼 •算術編碼 •行程編碼 •Lempel zev編碼
(2)有損壓縮編碼種類 •預測編碼：DPCM，運動補償 •頻率域方法：正文變換編碼(如DCT)，子帶編碼 •空間域方法：統計分塊編碼 •模型方法：分形編碼，模型基編碼 •基於重要性：濾波，子采樣，比特分配，矢量量化
(3)混合編碼 •JBIG，H261，JPEG，MPEG等技術標准
衡量一個壓縮編碼方法優劣的重要指標
(1)壓縮比要高，有幾倍、幾十倍，也有幾百乃至幾千倍；
(2)壓縮與解壓縮要快，演算法要簡單，硬體實現容易；
(3)解壓縮的圖像質量要好。
四、JPEG圖像壓縮演算法
1．.JPEG壓縮過程

JPEG壓縮分四個步驟實現：
1.顏色模式轉換及采樣；
2.DCT變換；
3.量化；
4.編碼。
2．1．顏色模式轉換及采樣
RGB色彩系統是我們最常用的表示顏色的方式。JPEG採用的是YCbCr色彩系統。想要用JPEG基本壓縮法處理全彩色圖像，得先把RGB顏色模式圖像數據，轉換為YCbCr顏色模式的數據。Y代表亮度，Cb和Cr則代表色度、飽和度。通過下列計算公式可完成數據轉換。
Y=0.2990R+0.5870G+0.1140B
Cb=-0.1687R-0.3313G+0.5000B+128
Cr=0.5000R-0.4187G-0.0813B＋128
人類的眼晴對低頻的數據比對高頻的數據具有更高的敏感度，事實上，人類
的眼睛對亮度的改變也比對色彩的改變要敏感得多，也就是說Y成份的數據是比較重要的。既然Cb成份和Cr成份的數據比較相對不重要，就可以只取部分數據來處理。以增加壓縮的比例。JPEG通常有兩種采樣方式：YUV411和YUV422，它們所代表的意義是Y、Cb和Cr三個成份的資料取樣比例。
2．2.DCT變換
DCT變換的全稱是離散餘弦變換(Discrete Cosine Transform)，是指將一組光強數據轉換成頻率數據，以便得知強度變化的情形。若對高頻的數據做些修飾，再轉回原來形式的數據時，顯然與原始數據有些差異，但是人類的眼睛卻是不容易辨認出來。
壓縮時，將原始圖像數據分成8*8數據單元矩陣，例如亮度值的第一個矩陣內容如下：

JPEG將整個亮度矩陣與色度Cb矩陣，飽和度Cr矩陣，視為一個基本單元稱作MCU。每個MCU所包含的矩陣數量不得超過10個。例如，行和列采樣的比例皆為4:2:2，則每個MCU將包含四個亮度矩陣，一個色度矩陣及一個飽和度矩陣。
當圖像數據分成一個8*8矩陣後，還必須將每個數值減去128，然後一一代入DCT變換公式中，即可達到DCT變換的目的。圖像數據值必須減去128，是因為DCT轉換公式所接受的數字范圍是在-128到+127之間。
DCT變換公式：

x,y代表圖像數據矩陣內某個數值的坐標位置
f(x,y)代表圖像數據矩陣內的數個數值
u,v代表DCT變換後矩陣內某個數值的坐標位置
F(u,v)代表DCT變換後矩陣內的某個數值
u=0 且 v=0 c(u)c(v)=1/1.414
u>0 或 v>0 c(u)c(v)=1
經過DCT變換後的矩陣數據自然數為頻率系數，這些系數以F（0，0）的值最大，稱為DC，其餘的63個頻率系數則多半是一些接近於0的正負浮點數，一概稱之為AC。
3．3、量化
圖像數據轉換為頻率系數後，還得接受一項量化程序，才能進入編碼階段。
量化階段需要兩個8*8矩陣數據，一個是專門處理亮度的頻率系數，另一個則是
針對色度的頻率系數，將頻率系數除以量化矩陣的值，取得與商數最近的整數，
即完成量化。
當頻率系數經過量化後，將頻率系數由浮點數轉變為整數，這才便於執行最
後的編碼。不過，經過量化階段後，所有數據只保留整數近似值，也就再度損失
了一些數據內容，JPEG提供的量化表如下：

2．4、編碼
Huffman編碼無專利權問題，成為JPEG最常用的編碼方式，Huffman編碼通常是以完整的MCU來進行的。
編碼時，每個矩陣數據的DC值與63個AC值，將分別使用不同的Huffman編碼表，而亮度與色度也需要不同的Huffman編碼表，所以一共需要四個編碼表，才能順利地完成JPEG編碼工作。
DC編碼
DC是彩採用差值脈沖編碼調制的差值編碼法，也就是在同一個圖像分量中取得每個DC值與前一個DC值的差值來編碼。DC採用差值脈沖編碼的主要原因是由於在連續色調的圖像中，其差值多半比原值小，對差值進行編碼所需的位數，會比對原值進行編碼所需的位數少許多。例如差值為5，它的二進製表示值為101，如果差值為-5，則先改為正整數5，再將其二進制轉換成1的補碼即可。所謂1的補碼，就是將每個Bit若值為0，便改成1；Bit為1，則變成0。差值5應保留的位數為3，下表即列出差值所應保留的Bit數與差值內容的對照。

在差值前端另外加入一些差值的霍夫曼碼值，例如亮度差值為5（101）的位數為3，則霍夫曼碼值應該是100，兩者連接在一起即為100101。下列兩份表格分別是亮度和色度DC差值的編碼表。根據這兩份表格內容，即可為DC差值加上霍夫曼碼值，完成DC的編碼工作。

AC編碼
AC編碼方式與DC略有不同，在AC編碼之前，首先得將63個AC值按Zig-zag排序，即按照下圖箭頭所指示的順序串聯起來。

63個AC值排列好的，將AC系數轉換成中間符號，中間符號表示為RRRR/SSSS，RRRR是指第非零的AC之前，其值為0的AC個數，SSSS是指AC值所需的位數，AC系數的范圍與SSSS的對應關系與DC差值Bits數與差值內容對照表相似。
如果連續為0的AC個數大於15，則用15/0來表示連續的16個0，15/0稱為ZRL（Zero Rum Length），而（0/0）稱為EOB（Enel of Block）用來表示其後所
剩餘的AC系數皆等於0，以中間符號值作為索引值，從相應的AC編碼表中找出適當的霍夫曼碼值，再與AC值相連即可。
例如某一組亮度的中間符為5/3，AC值為4，首先以5/3為索引值，從亮度AC的Huffman編碼表中找到1111111110011110霍夫曼碼值，於是加上原來100（4）即是用來取[5，4]的Huffman編碼1111111110011110100，[5，4]表示AC值為4的前面有5個零。
由於亮度AC，色度AC霍夫曼編碼表比較長，在此省略去，有興趣者可參閱相關書籍。
實現上述四個步驟，即完成一幅圖像的JPEG壓縮。

『肆』數據壓縮技術的數據壓縮技術簡史

電腦里的數據壓縮其實類似於美眉們的瘦身運動，不外有兩大功用。第一，可以節省空間。拿瘦身美眉來說，要是八個美眉可以擠進一輛計程車里，那該有多省錢啊！第二，可以減少對帶寬的佔用。例如，我們都想在不到 100Kbps 的 GPRS 網上觀看 DVD 大片，這就好比瘦身美眉們總希望用一尺布裁出七件吊帶衫，前者有待於數據壓縮技術的突破性進展，後者則取決於美眉們的恆心和毅力。
簡單地說，如果沒有數據壓縮技術，我們就沒法用 WinRAR 為 Email 中的附件瘦身；如果沒有數據壓縮技術，市場上的數碼錄音筆就只能記錄不到 20 分鍾的語音；如果沒有數據壓縮技術，從 Internet 上下載一部電影也許要花半年的時間……可是這一切究竟是如何實現的呢？數據壓縮技術又是怎樣從無到有發展起來的呢？一千多年前的中國學者就知道用「班馬」這樣的縮略語來指代班固和司馬遷，這種崇尚簡約的風俗一直延續到了今天的 Internet 時代：當我們在 BBS 上用「 7456 」代表「氣死我了」，或是用「 B4 」代表「 Before 」的時候，我們至少應該知道，這其實就是一種最簡單的數據壓縮呀。
嚴格意義上的數據壓縮起源於人們對概率的認識。當我們對文字信息進行編碼時，如果為出現概率較高的字母賦予較短的編碼，為出現概率較低的字母賦予較長的編碼，總的編碼長度就能縮短不少。遠在計算機出現之前，著名的 Morse 電碼就已經成功地實踐了這一準則。在 Morse 碼表中，每個字母都對應於一個唯一的點劃組合，出現概率最高的字母 e 被編碼為一個點「 . 」，而出現概率較低的字母 z 則被編碼為「 --.. 」。顯然，這可以有效縮短最終的電碼長度。
資訊理論之父 C. E. Shannon 第一次用數學語言闡明了概率與信息冗餘度的關系。在 1948 年發表的論文「通信的數學理論（ A Mathematical Theory of Communication ）」中， Shannon 指出，任何信息都存在冗餘，冗餘大小與信息中每個符號（數字、字母或單詞）的出現概率或者說不確定性有關。 Shannon 借鑒了熱力學的概念，把信息中排除了冗餘後的平均信息量稱為「信息熵」，並給出了計算信息熵的數學表達式。這篇偉大的論文後來被譽為資訊理論的開山之作，信息熵也奠定了所有數據壓縮演算法的理論基礎。從本質上講，數據壓縮的目的就是要消除信息中的冗餘，而信息熵及相關的定理恰恰用數學手段精確地描述了信息冗餘的程度。利用信息熵公式，人們可以計算出信息編碼的極限，即在一定的概率模型下，無損壓縮的編碼長度不可能小於信息熵公式給出的結果。
有了完備的理論，接下來的事就是要想辦法實現具體的演算法，並盡量使演算法的輸出接近信息熵的極限了。當然，大多數工程技術人員都知道，要將一種理論從數學公式發展成實用技術，就像僅憑一個 E=mc 2 的公式就要去製造核武器一樣，並不是一件很容易的事。設計具體的壓縮演算法的過程通常更像是一場數學游戲。開發者首先要尋找一種能盡量精確地統計或估計信息中符號出現概率的方法，然後還要設計一套用最短的代碼描述每個符號的編碼規則。統計學知識對於前一項工作相當有效，迄今為止，人們已經陸續實現了靜態模型、半靜態模型、自適應模型、 Markov 模型、部分匹配預測模型等概率統計模型。相對而言，編碼方法的發展歷程更為曲折一些。
1948 年， Shannon 在提出信息熵理論的同時，也給出了一種簡單的編碼方法—— Shannon 編碼。 1952 年， R. M. Fano 又進一步提出了 Fano 編碼。這些早期的編碼方法揭示了變長編碼的基本規律，也確實可以取得一定的壓縮效果，但離真正實用的壓縮演算法還相去甚遠。
第一個實用的編碼方法是由 D. A. Huffman 在 1952 年的論文「最小冗餘度代碼的構造方法（ A Method for the Construction of Minimum Rendancy Codes ）」中提出的。直到今天，許多《數據結構》教材在討論二叉樹時仍要提及這種被後人稱為 Huffman 編碼的方法。 Huffman 編碼在計算機界是如此著名，以至於連編碼的發明過程本身也成了人們津津樂道的話題。據說， 1952 年時，年輕的 Huffman 還是麻省理工學院的一名學生，他為了向老師證明自己可以不參加某門功課的期末考試，才設計了這個看似簡單，但卻影響深遠的編碼方法。
Huffman 編碼效率高，運算速度快，實現方式靈活，從 20 世紀 60 年代至今，在數據壓縮領域得到了廣泛的應用。例如，早期 UNIX 系統上一個不太為現代人熟知的壓縮程序 COMPACT 實際就是 Huffman 0 階自適應編碼的具體實現。 20 世紀 80 年代初， Huffman 編碼又出現在 CP/M 和 DOS 系統中，其代表程序叫 SQ 。今天，在許多知名的壓縮工具和壓縮演算法（如 WinRAR 、 gzip 和 JPEG ）里，都有 Huffman 編碼的身影。不過， Huffman 編碼所得的編碼長度只是對信息熵計算結果的一種近似，還無法真正逼近信息熵的極限。正因為如此，現代壓縮技術通常只將 Huffman 視作最終的編碼手段，而非數據壓縮演算法的全部。
科學家們一直沒有放棄向信息熵極限挑戰的理想。 1968 年前後， P. Elias 發展了 Shannon 和 Fano 的編碼方法，構造出從數學角度看來更為完美的 Shannon-Fano-Elias 編碼。沿著這一編碼方法的思路， 1976 年， J. Rissanen 提出了一種可以成功地逼近信息熵極限的編碼方法——算術編碼。 1982 年， Rissanen 和 G. G. Langdon 一起改進了算術編碼。之後，人們又將算術編碼與 J. G. Cleary 和 I. H. Witten 於 1984 年提出的部分匹配預測模型（ PPM ）相結合，開發出了壓縮效果近乎完美的演算法。今天，那些名為 PPMC 、 PPMD 或 PPMZ 並號稱壓縮效果天下第一的通用壓縮演算法，實際上全都是這一思路的具體實現。
對於無損壓縮而言， PPM 模型與算術編碼相結合，已經可以最大程度地逼近信息熵的極限。看起來，壓縮技術的發展可以到此為止了。不幸的是，事情往往不像想像中的那樣簡單：算術編碼雖然可以獲得最短的編碼長度，但其本身的復雜性也使得算術編碼的任何具體實現在運行時都慢如蝸牛。即使在摩爾定律大行其道， CPU 速度日新月異的今天，算術編碼程序的運行速度也很難滿足日常應用的需求。沒辦法，如果不是後文將要提到的那兩個猶太人，我們還不知要到什麼時候才能用上 WinZIP 這樣方便實用的壓縮工具呢。逆向思維永遠是科學和技術領域里出奇制勝的法寶。就在大多數人絞盡腦汁想改進 Huffman 或算術編碼，以獲得一種兼顧了運行速度和壓縮效果的「完美」編碼的時候，兩個聰明的猶太人 J. Ziv 和 A. Lempel 獨辟蹊徑，完全脫離 Huffman 及算術編碼的設計思路，創造出了一系列比 Huffman 編碼更有效，比算術編碼更快捷的壓縮演算法。我們通常用這兩個猶太人姓氏的縮寫，將這些演算法統稱為 LZ 系列演算法。
按照時間順序， LZ 系列演算法的發展歷程大致是： Ziv 和 Lempel 於 1977 年發表題為「順序數據壓縮的一個通用演算法（ A Universal Algorithm for Sequential Data Compression ）」的論文，論文中描述的演算法被後人稱為 LZ77 演算法。 1978 年，二人又發表了該論文的續篇「通過可變比率編碼的獨立序列的壓縮（ Compression of Indivial Sequences via Variable Rate Coding ）」，描述了後來被命名為 LZ78 的壓縮演算法。 1984 年， T. A. Welch 發表了名為「高性能數據壓縮技術（ A Technique for High Performance Data Compression ）」的論文，描述了他在 Sperry 研究中心（該研究中心後來並入了 Unisys 公司）的研究成果，這是 LZ78 演算法的一個變種，也就是後來非常有名的 LZW 演算法。 1990 年後， T. C. Bell 等人又陸續提出了許多 LZ 系列演算法的變體或改進版本。
說實話， LZ 系列演算法的思路並不新鮮，其中既沒有高深的理論背景，也沒有復雜的數學公式，它們只是簡單地延續了千百年來人們對字典的追崇和喜好，並用一種極為巧妙的方式將字典技術應用於通用數據壓縮領域。通俗地說，當你用字典中的頁碼和行號代替文章中每個單詞的時候，你實際上已經掌握了 LZ 系列演算法的真諦。這種基於字典模型的思路在表面上雖然和 Shannon 、 Huffman 等人開創的統計學方法大相徑庭，但在效果上一樣可以逼近信息熵的極限。而且，可以從理論上證明， LZ 系列演算法在本質上仍然符合信息熵的基本規律。
LZ 系列演算法的優越性很快就在數據壓縮領域里體現了出來，使用 LZ 系列演算法的工具軟體數量呈爆炸式增長。 UNIX 系統上最先出現了使用 LZW 演算法的 compress 程序，該程序很快成為了 UNIX 世界的壓縮標准。緊隨其後的是 MS-DOS 環境下的 ARC 程序，以及 PKWare 、 PKARC 等仿製品。 20 世紀 80 年代，著名的壓縮工具 LHarc 和 ARJ 則是 LZ77 演算法的傑出代表。
今天， LZ77 、 LZ78 、 LZW 演算法以及它們的各種變體幾乎壟斷了整個通用數據壓縮領域，我們熟悉的 PKZIP 、 WinZIP 、 WinRAR 、 gzip 等壓縮工具以及 ZIP 、 GIF 、 PNG 等文件格式都是 LZ 系列演算法的受益者，甚至連 PGP 這樣的加密文件格式也選擇了 LZ 系列演算法作為其數據壓縮的標准。
沒有誰能否認兩位猶太人對數據壓縮技術的貢獻。我想強調的只是，在工程技術領域，片面追求理論上的完美往往只會事倍功半，如果大家能像 Ziv 和 Lempel 那樣，經常換個角度來思考問題，沒准兒你我就能發明一種新的演算法，就能在技術方展史上揚名立萬呢。 LZ 系列演算法基本解決了通用數據壓縮中兼顧速度與壓縮效果的難題。但是，數據壓縮領域里還有另一片更為廣闊的天地等待著我們去探索。 Shannon 的資訊理論告訴我們，對信息的先驗知識越多，我們就可以把信息壓縮得越小。換句話說，如果壓縮演算法的設計目標不是任意的數據源，而是基本屬性已知的特種數據，壓縮的效果就會進一步提高。這提醒我們，在發展通用壓縮演算法之餘，還必須認真研究針對各種特殊數據的專用壓縮演算法。比方說，在今天的數碼生活中，遍布於數碼相機、數碼錄音筆、數碼隨身聽、數碼攝像機等各種數字設備中的圖像、音頻、視頻信息，就必須經過有效的壓縮才能在硬碟上存儲或是通過 USB 電纜傳輸。實際上，多媒體信息的壓縮一直是數據壓縮領域里的重要課題，其中的每一個分支都有可能主導未來的某個技術潮流，並為數碼產品、通信設備和應用軟體開發商帶來無限的商機。
讓我們先從圖像數據的壓縮講起。通常所說的圖像可以被分為二值圖像、灰度圖像、彩色圖像等不同的類型。每一類圖像的壓縮方法也不盡相同。
傳真技術的發明和廣泛使用促進了二值圖像壓縮演算法的飛速發展。 CCITT （國際電報電話咨詢委員會，是國際電信聯盟 ITU 下屬的一個機構）針對傳真類應用建立了一系列圖像壓縮標准，專用於壓縮和傳遞二值圖像。這些標准大致包括 20 世紀 70 年代後期的 CCITT Group 1 和 Group 2 ， 1980 年的 CCITT Group 3 ，以及 1984 年的 CCITT Group 4 。為了適應不同類型的傳真圖像，這些標准所用的編碼方法包括了一維的 MH 編碼和二維的 MR 編碼，其中使用了行程編碼（ RLE ）和 Huffman 編碼等技術。今天，我們在辦公室或家裡收發傳真時，使用的大多是 CCITT Group 3 壓縮標准，一些基於數字網路的傳真設備和存放二值圖像的 TIFF 文件則使用了 CCITT Group 4 壓縮標准。 1993 年， CCITT 和 ISO （國際標准化組織）共同成立的二值圖像聯合專家組（ Joint Bi-level Image Experts Group ， JBIG ）又將二值圖像的壓縮進一步發展為更加通用的 JBIG 標准。
實際上，對於二值圖像和非連續的灰度、彩色圖像而言，包括 LZ 系列演算法在內的許多通用壓縮演算法都能獲得很好的壓縮效果。例如，誕生於 1987 年的 GIF 圖像文件格式使用的是 LZW 壓縮演算法， 1995 年出現的 PNG 格式比 GIF 格式更加完善，它選擇了 LZ77 演算法的變體 zlib 來壓縮圖像數據。此外，利用前面提到過的 Huffman 編碼、算術編碼以及 PPM 模型，人們事實上已經構造出了許多行之有效的圖像壓縮演算法。
但是，對於生活中更加常見的，像素值在空間上連續變化的灰度或彩色圖像（比如數碼照片），通用壓縮演算法的優勢就不那麼明顯了。幸運的是，科學家們發現，如果在壓縮這一類圖像數據時允許改變一些不太重要的像素值，或者說允許損失一些精度（在壓縮通用數據時，我們絕不會容忍任何精度上的損失，但在壓縮和顯示一幅數碼照片時，如果一片樹林里某些樹葉的顏色稍微變深了一些，看照片的人通常是察覺不到的），我們就有可能在壓縮效果上獲得突破性的進展。這一思想在數據壓縮領域具有革命性的地位：通過在用戶的忍耐范圍內損失一些精度，我們可以把圖像（也包括音頻和視頻）壓縮到原大小的十分之一、百分之一甚至千分之一，這遠遠超出了通用壓縮演算法的能力極限。也許，這和生活中常說的「退一步海闊天空」的道理有異曲同工之妙吧。
這種允許精度損失的壓縮也被稱為有損壓縮。在圖像壓縮領域，著名的 JPEG 標準是有損壓縮演算法中的經典。 JPEG 標准由靜態圖像聯合專家組（ Joint Photographic Experts Group ， JPEG ）於 1986 年開始制定， 1994 年後成為國際標准。 JPEG 以離散餘弦變換（ DCT ）為核心演算法，通過調整質量系數控制圖像的精度和大小。對於照片等連續變化的灰度或彩色圖像， JPEG 在保證圖像質量的前提下，一般可以將圖像壓縮到原大小的十分之一到二十分之一。如果不考慮圖像質量， JPEG 甚至可以將圖像壓縮到「無限小」。
JPEG 標準的最新進展是 1996 年開始制定， 2001 年正式成為國際標準的 JPEG 2000 。與 JPEG 相比， JPEG 2000 作了大幅改進，其中最重要的是用離散小波變換（ DWT ）替代了 JPEG 標准中的離散餘弦變換。在文件大小相同的情況下， JPEG 2000 壓縮的圖像比 JPEG 質量更高，精度損失更小。作為一個新標准， JPEG 2000 暫時還沒有得到廣泛的應用，不過包括數碼相機製造商在內的許多企業都對其應用前景表示樂觀， JPEG 2000 在圖像壓縮領域里大顯身手的那一天應該不會特別遙遠。
JPEG 標准中通過損失精度來換取壓縮效果的設計思想直接影響了視頻數據的壓縮技術。 CCITT 於 1988 年制定了電視電話和會議電視的 H.261 建議草案。 H.261 的基本思路是使用類似 JPEG 標準的演算法壓縮視頻流中的每一幀圖像，同時採用運動補償的幀間預測來消除視頻流在時間維度上的冗餘信息。在此基礎上， 1993 年， ISO 通過了動態圖像專家組（ Moving Picture Experts Group ， MPEG ）提出的 MPEG-1 標准。 MPEG-1 可以對普通質量的視頻數據進行有效編碼。我們現在看到的大多數 VCD 影碟，就是使用 MPEG-1 標准來壓縮視頻數據的。
為了支持更清晰的視頻圖像，特別是支持數字電視等高端應用， ISO 於 1994 年提出了新的 MPEG-2 標准（相當於 CCITT 的 H.262 標准）。 MPEG-2 對圖像質量作了分級處理，可以適應普通電視節目、會議電視、高清晰數字電視等不同質量的視頻應用。在我們的生活中，可以提供高清晰畫面的 DVD 影碟所採用的正是 MPEG-2 標准。
Internet 的發展對視頻壓縮提出了更高的要求。在內容交互、對象編輯、隨機存取等新需求的刺激下， ISO 於 1999 年通過了 MPEG-4 標准（相當於 CCITT 的 H.263 和 H.263+ 標准）。 MPEG-4 標准擁有更高的壓縮比率，支持並發數據流的編碼、基於內容的交互操作、增強的時間域隨機存取、容錯、基於內容的尺度可變性等先進特性。 Internet 上新興的 DivX 和 XviD 文件格式就是採用 MPEG-4 標准來壓縮視頻數據的，它們可以用更小的存儲空間或通信帶寬提供與 DVD 不相上下的高清晰視頻，這使我們在 Internet 上發布或下載數字電影的夢想成為了現實。
就像視頻壓縮和電視產業的發展密不可分一樣，音頻數據的壓縮技術最早也是由無線電廣播、語音通信等領域里的技術人員發展起來的。這其中又以語音編碼和壓縮技術的研究最為活躍。自從 1939 年 H. Dudley 發明聲碼器以來，人們陸續發明了脈沖編碼調制（ PCM ）、線性預測（ LPC ）、矢量量化（ VQ ）、自適應變換編碼（ ATC ）、子帶編碼（ SBC ）等語音分析與處理技術。這些語音技術在採集語音特徵，獲取數字信號的同時，通常也可以起到降低信息冗餘度的作用。像圖像壓縮領域里的 JPEG 一樣，為獲得更高的編碼效率，大多數語音編碼技術都允許一定程度的精度損失。而且，為了更好地用二進制數據存儲或傳送語音信號，這些語音編碼技術在將語音信號轉換為數字信息之後又總會用 Huffman 編碼、算術編碼等通用壓縮演算法進一步減少數據流中的冗餘信息。
對於電腦和數字電器（如數碼錄音筆、數碼隨身聽）中存儲的普通音頻信息，我們最常使用的壓縮方法主要是 MPEG 系列中的音頻壓縮標准。例如， MPEG-1 標准提供了 Layer I 、 Layer II 和 Layer III 共三種可選的音頻壓縮標准， MPEG-2 又進一步引入了 AAC （ Advanced Audio Coding ）音頻壓縮標准， MPEG-4 標准中的音頻部分則同時支持合成聲音編碼和自然聲音編碼等不同類型的應用。在這許多音頻壓縮標准中，聲名最為顯赫的恐怕要數 MPEG-1 Layer III ，也就是我們常說的 MP3 音頻壓縮標准了。從 MP3 播放器到 MP3 手機，從硬碟上堆積如山的 MP3 文件到 Internet 上版權糾紛不斷的 MP3 下載， MP3 早已超出了數據壓縮技術的范疇，而成了一種時尚文化的象徵了。
很顯然，在多媒體信息日益成為主流信息形態的數字化時代里，數據壓縮技術特別是專用於圖像、音頻、視頻的數據壓縮技術還有相當大的發展空間——畢竟，人們對信息數量和信息質量的追求是永無止境的。從信息熵到算術編碼，從猶太人到 WinRAR ，從 JPEG 到 MP3 ，數據壓縮技術的發展史就像是一個寫滿了「創新」、「挑戰」、「突破」和「變革」的羊皮卷軸。也許，我們在這里不厭其煩地羅列年代、人物、標准和文獻，其目的只是要告訴大家，前人的成果只不過是後人有望超越的目標而已，誰知道在未來的幾年裡，還會出現幾個 Shannon ，幾個 Huffman 呢？
談到未來，我們還可以補充一些與數據壓縮技術的發展趨勢有關的話題。
1994年， M. Burrows 和 D. J. Wheeler 共同提出了一種全新的通用數據壓縮演算法。這種演算法的核心思想是對字元串輪轉後得到的字元矩陣進行排序和變換，類似的變換演算法被稱為 Burrows-Wheeler 變換，簡稱 BWT 。與 Ziv 和 Lempel 另闢蹊徑的做法如出一轍， Burrows 和 Wheeler 設計的 BWT 演算法與以往所有通用壓縮演算法的設計思路都迥然不同。如今， BWT 演算法在開放源碼的壓縮工具 bzip 中獲得了巨大的成功， bzip 對於文本文件的壓縮效果要遠好於使用 LZ 系列演算法的工具軟體。這至少可以表明，即便在日趨成熟的通用數據壓縮領域，只要能在思路和技術上不斷創新，我們仍然可以找到新的突破口。
分形壓縮技術是圖像壓縮領域近幾年來的一個熱點。這一技術起源於 B. Mandelbrot 於 1977 年創建的分形幾何學。 M. Barnsley 在 20 世紀 80 年代後期為分形壓縮奠定了理論基礎。從 20 世紀 90 年代開始， A. Jacquin 等人陸續提出了許多實驗性的分形壓縮演算法。今天，很多人相信，分形壓縮是圖像壓縮領域里最有潛力的一種技術體系，但也有很多人對此不屑一顧。無論其前景如何，分形壓縮技術的研究與發展都提示我們，在經過了幾十年的高速發展之後，也許，我們需要一種新的理論，或是幾種更有效的數學模型，以支撐和推動數據壓縮技術繼續向前躍進。
人工智慧是另一個可能對數據壓縮的未來產生重大影響的關鍵詞。既然 Shannon 認為，信息能否被壓縮以及能在多大程度上被壓縮與信息的不確定性有直接關系，假設人工智慧技術在某一天成熟起來，假設計算機可以像人一樣根據已知的少量上下文猜測後續的信息，那麼，將信息壓縮到原大小的萬分之一乃至十萬分之一，恐怕就不再是天方夜譚了。
回顧歷史之後，人們總喜歡暢想一下未來。但未來終究是未來，如果僅憑你我幾句話就可以理清未來的技術發展趨勢，那技術創新的工作豈不就索然無味了嗎？依我說，未來並不重要，重要的是，趕快到 Internet 上下載幾部大片，然後躺在沙發里，好好享受一下數據壓縮為我們帶來的無限快樂吧。

『伍』求一篇「對多媒體的數據壓縮技術或數據加密技術做實例分析，並研究它的發展趨勢」有關的論文。

多媒體數據壓縮方法分類數據的壓縮實際上是一個編碼過程，即把原始的數據進行編碼壓縮。數據的解壓縮是數據壓縮的逆過程，即把壓縮的編碼還原為原始數據。因此數據壓縮方法也稱為編碼方法。目前數據壓縮技術日臻惱，適應各種應用場合的編碼方法不斷產生。針對多媒體數據冗餘類型的不同，相應地有不同的壓縮方法。按照壓縮方法是否產生失真分類根據解碼後數據與原始數據是否完全一致進行分類，壓縮方法可被分為有失真編碼和無失真編碼兩大類。有失真壓縮法會壓縮了熵，會減少信息量，而損失的信息是不能再恢復的，因此這種壓縮法是不可逆的。無失真壓縮法掉或減少數據中的冗餘，但這些冗餘值是可以重新插入到數據中的，因此冗餘壓縮是可逆的過程。無失真壓縮是不會產生失真。從信息主義角度講，無失真編碼是泛指那種不考慮被壓縮信息性質和壓縮技術。它是基於平均信息量的技術，並把所有的數據當做比特序列，而不是根據壓縮信息的類型來優化壓縮。也就是說，平均信息量編碼忽略被壓縮信息主義內容。在多媒體技術中一般用於文本、數據的壓縮，它能保證百分之百地恢復原始數據。但這種方法壓縮比較低，如LZW編碼、行程編碼、霍夫曼（Huffman）編碼的壓縮比一般在2：1至5：1之間。按照壓縮方法的原理分類根據編碼原理進行分類，大致有編碼、變換編碼、統計編碼、分析－合成編碼、混合編碼和其他一些編碼方法。其中統計編碼是無失真的編碼，其他編碼方法基本上都是有失真的編碼。預測編碼是針對空間冗餘的壓縮方法，其基本思想是利用已被編碼的點的數據值，預測鄰近的一個像素點的數據值。預測根據某個模型進行。如果模型選取得足夠好的話，則只需存儲和傳輸起始像素和模型參數就可代表全部數據了。按照模型的不同，預測編碼又可分為線性預測、幀內預測和幀間預測。變換編碼也是針對空間冗餘和時間冗餘的壓縮方法。其基本思想是將圖像的光強矩陣（時域信號）變換到系統空間（頻域）上，然後對系統進行編碼壓縮。在空間上具有強相關性的信號，反映在頻域上是某些特定區域內的能量常常被集中在一起，或者是系數矩陣的發布具有某些規律。可以利用這些規律，分配頻域上的量化比特數，從而達到壓縮的目的。由於時域映射到頻域總是通過某種變換進行的，因此稱變換編碼。因為正交變換的變換矩陣是可逆的，且逆矩陣與轉換置矩陣相等，解碼運算方便且保證有解，所以變換編碼總是採用正交變換。統計編碼屬於無失真編碼。它是根據信息出現概率的分布而進行的壓縮編碼。編碼時某種比特或位元組模式的出現概率大，用較短的碼字表示；出現概率小，用較長的碼字表示。這樣，可以保證總的平均碼長最短。最常用的統計編碼方法是哈夫曼編碼方法。分析-合成編碼實質上都是通過對原始數據的分析，將其分解成一系列更適合於表示「基元」或從中提取若干具有更為本質意義的參數，編碼僅對這些基本單元或特徵參數進行。解碼時則藉助於一定的規則或模型，按一定的演算法將這些基元或參數，「綜合」成原數據的一個逼近。這種編碼方法可能得到極高的數據壓縮比。混合編碼綜合兩種以上的編碼方法，這些編碼方法必須針對不同的冗餘進行壓縮，使總的壓縮性能得到加強。

『陸』 zip 的壓縮原理與實現

文件壓縮原理

我們使用計算機所做的事情大多都是對文件進行處理。每個文件都會佔用一定的磁碟空間，我們希望一些文件，尤其是暫時不用但又比較重要不能刪除的文件（如備份文件，有點像雞肋呀），盡可能少的佔用磁碟空間。但是，許多文件的存儲格式是比較鬆散的，這樣就浪費了一些寶貴的計算機存儲資源。這時，我們可以藉助壓縮工具解決這個問題，通過對原來的文件進行壓縮處理，使之用更少的磁碟空間保存起來，當需要使用時再進行解壓縮操作，這樣就大大節省了磁碟空間。當你要拷貝許多小文件時，通過壓縮處理可以提高執行效率。如果小文件很多，操作系統要執行頻繁的文件定位操作，需要花費很多的時間。如果先把這些小文件壓縮，變成一個壓縮文件後，再拷貝時就很方便了。由於計算機處理的信息是以二進制數的形式表示的，因此壓縮軟體就是把二進制信息中相同的字元串以特殊字元標記來達到壓縮的目的。為了有助於理解文件壓縮，請您在腦海里想像一幅藍天白雲的圖片。對於成千上萬單調重復的藍色像點而言，與其一個一個定義「藍、藍、藍……」長長的一串顏色，還不如告訴電腦：「從這個位置開始存儲1117個藍色像點」來得簡潔，而且還能大大節約存儲空間。這是一個非常簡單的圖像壓縮的例子。其實，所有的計算機文件歸根結底都是以「1」和「0」的形式存儲的，和藍色像點一樣，只要通過合理的數學計算公式，文件的體積都能夠被大大壓縮以達到「數據無損稠密」的效果。總的來說，壓縮可以分為有損和無損壓縮兩種。如果丟失個別的數據不會造成太大的影響，這時忽略它們是個好主意，這就是有損壓縮。有損壓縮廣泛應用於動畫、聲音和圖像文件中，典型的代表就是影碟文件格式mpeg、音樂文件格式mp3和圖像文件格式jpg。但是更多情況下壓縮數據必須准確無誤，人們便設計出了無損壓縮格式，比如常見的zip、rar等。壓縮軟體（compression software）自然就是利用壓縮原理壓縮數據的工具，壓縮後所生成的文件稱為壓縮包（archive），體積只有原來的幾分之一甚至更小。當然，壓縮包已經是另一種文件格式了，如果你想使用其中的數據，首先得用壓縮軟體把數據還原，這個過程稱作解壓縮。常見的壓縮軟體有winzip、winrar等

『柒』想寫一篇碩士研究生論文：鐵路橋梁動態監測數據壓縮技術研究

公司比個人可靠，交給中州期刊聯盟，原創，帶檢測報告，保護作者隱私。

『捌』圖像壓縮編碼論文

數字圖像壓縮技術的研究及進展

摘要：數字圖像壓縮技術對於數字圖像信息在網路上實現快速傳輸和實時處理具有重要的意義。本文介紹了當前幾種最為重要的圖像壓縮演算法：JPEG、JPEG2000、分形圖像壓縮和小波變換圖像壓縮，總結了它們的優缺點及發展前景。然後簡介了任意形狀可視對象編碼演算法的研究現狀，並指出此演算法是一種產生高壓縮比的圖像壓縮演算法。關鍵詞：JPEG；JPEG2000；分形圖像壓縮；小波變換；任意形狀可視對象編碼一引言隨著多媒體技術和通訊技術的不斷發展，多媒體娛樂、信息高速公路等不斷對信息數據的存儲和傳輸提出了更高的要求，也給現有的有限帶寬以嚴峻的考驗，特別是具有龐大數據量的數字圖像通信，更難以傳輸和存儲，極大地制約了圖像通信的發展，因此圖像壓縮技術受到了越來越多的關注。圖像壓縮的目的就是把原來較大的圖像用盡量少的位元組表示和傳輸，並且要求復原圖像有較好的質量。利用圖像壓縮，可以減輕圖像存儲和傳輸的負擔，使圖像在網路上實現快速傳輸和實時處理。圖像壓縮編碼技術可以追溯到1948年提出的電視信號數字化，到今天已經有50多年的歷史了[1]。在此期間出現了很多種圖像壓縮編碼方法，特別是到了80年代後期以後，由於小波變換理論，分形理論，人工神經網路理論，視覺模擬理論的建立，圖像壓縮技術得到了前所未有的發展，其中分形圖像壓縮和小波圖像壓縮是當前研究的熱點。本文對當前最為廣泛使用的圖像壓縮演算法進行綜述，討論了它們的優缺點以及發展前景。二 JPEG壓縮負責開發靜止圖像壓縮標準的「聯合圖片專家組」（Joint Photographic Expert Group,簡稱JPEG），於1989年1月形成了基於自適應DCT的JPEG技術規范的第一個草案，其後多次修改，至1991年形成ISO10918國際標准草案，並在一年後成為國際標准，簡稱JPEG標准。1．JPEG壓縮原理及特點 JPEG演算法中首先對圖像進行分塊處理，一般分成互不重疊的大小的塊，再對每一塊進行二維離散餘弦變換（DCT）。變換後的系數基本不相關，且系數矩陣的能量集中在低頻區，根據量化表進行量化，量化的結果保留了低頻部分的系數，去掉了高頻部分的系數。量化後的系數按zigzag掃描重新組織，然後進行哈夫曼編碼。JPEG的特點優點：（1）形成了國際標准；（2）具有中端和高端比特率上的良好圖像質量。缺點：（1）由於對圖像進行分塊，在高壓縮比時產生嚴重的方塊效應；（2）系數進行量化，是有損壓縮；（3）壓縮比不高，小於50。 JPEG壓縮圖像出現方塊效應的原因是：一般情況下圖像信號是高度非平穩的，很難用Gauss過程來刻畫，並且圖像中的一些突變結構例如邊緣信息遠比圖像平穩性重要，用餘弦基作圖像信號的非線性逼近其結果不是最優的。2． JPEG壓縮的研究狀況及其前景針對JPEG在高壓縮比情況下，產生方塊效應，解壓圖像較差，近年來提出了不少改進方法，最有效的是下面的兩種方法：（1）DCT零樹編碼 DCT零樹編碼把 DCT塊中的系數組成log2N個子帶，然後用零樹編碼方案進行編碼。在相同壓縮比的情況下，其PSNR的值比 EZW高。但在高壓縮比的情況下，方塊效應仍是DCT零樹編碼的致命弱點。（2）層式DCT零樹編碼此演算法對圖像作的DCT變換，將低頻塊集中起來，做反DCT變換；對新得到的圖像做相同變換，如此下去，直到滿足要求為止。然後對層式DCT變換及零樹排列過的系數進行零樹編碼。 JPEG壓縮的一個最大問題就是在高壓縮比時產生嚴重的方塊效應，因此在今後的研究中，應重點解決 DCT變換產生的方塊效應，同時考慮與人眼視覺特性相結合進行壓縮。三 JEPG2000壓縮 JPEG2000是由ISO/IEC JTCISC29標准化小組負責制定的全新靜止圖像壓縮標准。一個最大改進是它採用小波變換代替了餘弦變換。2000年3月的東京會議，確定了彩色靜態圖像的新一代編碼方式—JPEG2000圖像壓縮標準的編碼演算法。1．JPEG2000壓縮原理及特點 JPEG2000編解碼系統的編碼器和解碼器的框圖如圖1所示。編碼過程主要分為以下幾個過程：預處理、核心處理和位流組織。預處理部分包括對圖像分片、直流電平（DC）位移和分量變換。核心處理部分由離散小波變換、量化和熵編碼組成。位流組織部分則包括區域劃分、碼塊、層和包的組織。 JPEG2000格式的圖像壓縮比，可在現在的JPEG基礎上再提高10%~30%，而且壓縮後的圖像顯得更加細膩平滑。對於目前的JPEG標准，在同一個壓縮碼流中不能同時提供有損和無損壓縮，而在JPEG2000系統中，通過選擇參數，能夠對圖像進行有損和無損壓縮。現在網路上的JPEG圖像下載時是按「塊」傳輸的，而JPEG2000格式的圖像支持漸進傳輸，這使用戶不必接收整個圖像的壓縮碼流。由於JPEG2000採用小波技術，可隨機獲取某些感興趣的圖像區域（ROI）的壓縮碼流，對壓縮的圖像數據進行傳輸、濾波等操作。2．JPEG2000壓縮的前景 JPEG2000標准適用於各種圖像的壓縮編碼。其應用領域將包括Internet、傳真、列印、遙感、移動通信、醫療、數字圖書館和電子商務等。JPEG2000圖像壓縮標准將成為21世紀的主流靜態圖像壓縮標准。四小波變換圖像壓縮1．小波變換圖像壓縮原理小波變換用於圖像編碼的基本思想就是把圖像根據Mallat塔式快速小波變換演算法進行多解析度分解。其具體過程為：首先對圖像進行多級小波分解，然後對每層的小波系數進行量化，再對量化後的系數進行編碼。小波圖像壓縮是當前圖像壓縮的熱點之一，已經形成了基於小波變換的國際壓縮標准，如MPEG-4標准，及如上所述的JPEG2000標准。2．小波變換圖像壓縮的發展現狀及前景目前3個最高等級的小波圖像編碼分別是嵌入式小波零樹圖像編碼（EZW），分層樹中分配樣本圖像編碼（SPIHT）和可擴展圖像壓縮編碼（EBCOT）。（1）EZW編碼器 1993年，Shapiro引入了小波「零樹」的概念，通過定義POS、NEG、IZ和ZTR四種符號進行空間小波樹遞歸編碼，有效地剔除了對高頻系數的編碼，極大地提高了小波系數的編碼效率。此演算法採用漸進式量化和嵌入式編碼模式，演算法復雜度低。EZW演算法打破了信息處理領域長期篤信的准則：高效的壓縮編碼器必須通過高復雜度的演算法才能獲得，因此EZW編碼器在數據壓縮史上具有里程碑意義。（2）SPIHT編碼器由Said和Pearlman提出的分層小波樹集合分割演算法（SPIHT）則利用空間樹分層分割方法，有效地減小了比特面上編碼符號集的規模。同EZW相比，SPIHT演算法構造了兩種不同類型的空間零樹，更好地利用了小波系數的幅值衰減規律。同EZW編碼器一樣，SPIHT編碼器的演算法復雜度低，產生的也是嵌入式比特流，但編碼器的性能較EZW有很大的提高。（3）EBCOT編碼器優化截斷點的嵌入塊編碼方法（EBCOT）首先將小波分解的每個子帶分成一個個相對獨立的碼塊，然後使用優化的分層截斷演算法對這些碼塊進行編碼，產生壓縮碼流，結果圖像的壓縮碼流不僅具有SNR可擴展而且具有解析度可擴展，還可以支持圖像的隨機存儲。比較而言，EBCOT演算法的復雜度較EZW和SPIHT有所提高，其壓縮性能比SPIHT略有提高。
小波圖像壓縮被認為是當前最有發展前途的圖像壓縮演算法之一。小波圖像壓縮的研究集中在對小波系數的編碼問題上。在以後的工作中，應充分考慮人眼視覺特性，進一步提高壓縮比，改善圖像質量。並且考慮將小波變換與其他壓縮方法相結合。例如與分形圖像壓縮相結合是當前的一個研究熱點。
五分形圖像壓縮 1988年，Barnsley通過實驗證明分形圖像壓縮可以得到比經典圖像編碼技術高幾個數量級的壓縮比。1990年，Barnsley的學生A.E.Jacquin提出局部迭代函數系統理論後，使分形用於圖像壓縮在計算機上自動實現成為可能。1．分形圖像壓縮的原理分形壓縮主要利用自相似的特點，通過迭代函數系統（Iterated Function System, IFS）實現。其理論基礎是迭代函數系統定理和拼貼定理。分形圖像壓縮把原始圖像分割成若干個子圖像，然後每一個子圖像對應一個迭代函數，子圖像以迭代函數存儲，迭代函數越簡單，壓縮比也就越大。同樣解碼時只要調出每一個子圖像對應的迭代函數反復迭代，就可以恢復出原來的子圖像，從而得到原始圖像。2．幾種主要分形圖像編碼技術隨著分形圖像壓縮技術的發展，越來越多的演算法被提出，基於分形的不同特徵，可以分成以下幾種主要的分形圖像編碼方法。（1）尺碼編碼方法尺碼編碼方法是基於分形幾何中利用小尺度度量不規則曲線長度的方法，類似於傳統的亞取樣和內插方法，其主要不同之處在於尺度編碼方法中引入了分形的思想，尺度隨著圖像各個組成部分復雜性的不同而改變。（2）迭代函數系統方法迭代函數系統方法是目前研究最多、應用最廣泛的一種分形壓縮技術，它是一種人機交互的拼貼技術，它基於自然界圖像中普遍存在的整體和局部自相關的特點，尋找這種自相關映射關系的表達式，即仿射變換，並通過存儲比原圖像數據量小的仿射系數，來達到壓縮的目的。如果尋得的仿射變換簡單而有效，那麼迭代函數系統就可以達到極高的壓縮比。（3）A-E-Jacquin的分形方案 A-E-Jacquin的分形方案是一種全自動的基於塊的分形圖像壓縮方案，它也是一個尋找映射關系的過程，但尋找的對象域是將圖像分割成塊之後的局部與局部的關系。在此方案中還有一部分冗餘度可以去除，而且其解碼圖像中存在著明顯的方塊效應。3．分形圖像壓縮的前景雖然分形圖像壓縮在圖像壓縮領域還不佔主導地位，但是分形圖像壓縮既考慮局部與局部，又考慮局部與整體的相關性，適合於自相似或自仿射的圖像壓縮，而自然界中存在大量的自相似或自仿射的幾何形狀，因此它的適用范圍很廣。六其它壓縮演算法除了以上幾種常用的圖像壓縮方法以外，還有：NNT（數論變換）壓縮、基於神經網路的壓縮方法、Hibert掃描圖像壓縮方法、自適應多相子帶壓縮方法等，在此不作贅述。下面簡單介紹近年來任意形狀紋理編碼的幾種演算法[10]~ [13]。（1）形狀自適應DCT（SA-DCT）演算法 SA-DCT把一個任意形狀可視對象分成的圖像塊，對每塊進行DCT變換，它實現了一個類似於形狀自適應Gilge DCT[10][11]變換的有效變換，但它比Gilge DCT變換的復雜度要低。可是，SA-DCT也有缺點，它把像素推到與矩形邊框的一個側邊相平齊，因此一些空域相關性可能丟失，這樣再進行列DCT變換，就有較大的失真了[11][14][15]。（2）Egger方法 Egger等人[16][17]提出了一個應用於任意形狀對象的小波變換方案。在此方案中，首先將可視對象的行像素推到與邊界框的右邊界相平齊的位置，然後對每行的有用像素進行小波變換，接下來再進行另一方向的小波變換。此方案，充分利用了小波變換的局域特性。然而這一方案也有它的問題，例如可能引起重要的高頻部分同邊界部分合並，不能保證分布系數彼此之間有正確的相同相位，以及可能引起第二個方向小波分解的不連續等。（3）形狀自適應離散小波變換（SA-DWT） Li等人提出了一種新穎的任意形狀對象編碼，SA-DWT編碼[18]~[22]。這項技術包括SA-DWT和零樹熵編碼的擴展（ZTE），以及嵌入式小波編碼（EZW）。SA-DWT的特點是：經過SA-DWT之後的系數個數，同原任意形狀可視對象的像素個數相同；小波變換的空域相關性、區域屬性以及子帶之間的自相似性，在SA-DWT中都能很好表現出來；對於矩形區域，SA-DWT與傳統的小波變換一樣。SA-DWT編碼技術的實現已經被新的多媒體編碼標准MPEG-4的對於任意形狀靜態紋理的編碼所採用。在今後的工作中，可以充分地利用人類視覺系統對圖像邊緣部分較敏感的特性，嘗試將圖像中感興趣的對象分割出來，對其邊緣部分、內部紋理部分和對象之外的背景部分按不同的壓縮比進行壓縮，這樣可以使壓縮圖像達到更大的壓縮比，更加便於傳輸。七總結圖像壓縮技術研究了幾十年，取得了很大的成績，但還有許多不足，值得我們進一步研究。小波圖像壓縮和分形圖像壓縮是當前研究的熱點，但二者也有各自的缺點，在今後工作中，應與人眼視覺特性相結合。總之，圖像壓縮是一個非常有發展前途的研究領域，這一領域的突破對於我們的信息生活和通信事業的發展具有深遠的影響。

參考文獻：[1] 田青. 圖像壓縮技術[J]. 警察技術, 2002, (1)：30-31.[2] 張海燕, 王東木等. 圖像壓縮技術[J]. 系統模擬學報, 2002, 14(7)：831-835.[3] 張宗平, 劉貴忠. 基於小波的視頻圖像壓縮研究進展[J]. 電子學報, 2002, 30(6)：883-889.
[4] 周寧, 湯曉軍, 徐維朴. JPEG2000圖像壓縮標准及其關鍵演算法[J]. 現代電子技術, 2002, (12)：1-5.[5] 吳永輝, 俞建新. JPEG2000圖像壓縮演算法概述及網路應用前景[J]. 計算機工程, 2003, 29(3)：7-10.[6] J M Shaprio. Embedded image coding using zerotree of wavelet coefficients[J]. IEEE Trans. on Signal Processing, 1993, 41(12): 3445-3462.[7] A Said, W A Pearlman. A new fast and efficient image codec based on set partitioning in hierarchical trees[J]. IEEE Trans. on Circuits and Systems for Video Tech. 1996, 6(3): 243-250.[8] D Taubman. High performance scalable image compression with EBCOT[J]. IEEE Transactions on Image Processing, 2000, 9(7): 1158–1170.[9] 徐林靜, 孟利民, 朱建軍. 小波與分行在圖像壓縮中的比較及應用. 中國有線電視, 2003, 03/04：26-29.[10] M Gilge, T Engelhardt, R Mehlan. Coding of arbitrarily shaped image segments based on a generalized orthogonal transform[J]. Signal Processing: Image Commun., 1989, 1(10): 153–180.[11] T Sikora, B Makai. Shape-adaptive DCT for generic coding of video[J]. IEEE Trans. Circuits Syst. Video Technol., 1995, 5(1): 59–62.[12] T Sikora, S Bauer, B Makai. Efficiency of shape-adaptive 2-D transforms for coding of arbitrarily shaped image segments[J]. IEEE Trans. Circuits Syst. Video Technol., 1995, 5(3): 254–258.[13]鄧家先康耀紅編著《資訊理論與編碼》

『玖』計算機論文數據壓縮的重要性和意義

往大數據（數據挖掘）方向寫，包你寫幾十萬字都跟玩兒似的。（火星人）3393

『拾』關於數據壓縮編碼課題的論文，希望專業的技術人員能幫下忙！在那裡可以找到相關的論文

. 我可搞定

導航:首頁 > 文件處理 > 數據壓縮論文

數據壓縮論文

與數據壓縮論文相關的資料