導航:首頁 > 文件處理 > 壓縮原理

壓縮原理

發布時間:2022-02-07 20:08:49

『壹』 壓縮的壓縮原理

利用演算法將文件有損或無損地處理,以達到保留最多文件信息,而令文件體積變小。壓縮文件的基本原理是查找文件內的重復位元組,並建立一個相同位元組的"詞典"文件,並用一個代碼表示,比如在文件里有幾處有一個相同的詞"中華人民共和國"用一個代碼表示並寫入"詞典"文件,這樣就可以達到縮小文件的目的軟體。由於計算機處理的信息是以二進制數的形式表示的,因此壓縮軟體就是把二進制信息中相同的字元串以特殊字元標記來達到壓縮的目的。為了有助於理解文件壓縮,請您在腦海里想像一幅藍天白雲的圖片。對於成千上萬單調重復的藍色像點而言,與其一個一個定義「藍、藍、藍……」長長的一串顏色,還不如告訴電腦:「從這個位置開始存儲1117個藍色像點」來得簡潔,而且還能大大節約存儲空間。這是一個非常簡單的圖像壓縮的例子。其實,所有的計算機文件歸根結底都是以「1」和「0」的形式存儲的,和藍色像點一樣,只要通過合理的數學計算公式,文件的體積都能夠被大大壓縮以達到「數據無損稠密」的效果。總的來說,壓縮可以分為有損和無損壓縮兩種。如果丟失個別的數據不會造成太大的影響,這時忽略它們是個好主意,這就是有損壓縮。有損壓縮廣泛應用於動畫、聲音和圖像文件中,典型的代表就是影碟文件格式mpeg、音樂文件格式mp3和圖像文件格式jpg。但是更多情況下壓縮數據必須准確無誤,人們便設計出了無損壓縮格式,比如常見的zip、rar等。壓縮軟體(compression software)自然就是利用壓縮原理壓縮數據的工具,壓縮後所生成的文件稱為壓縮包(archive),體積只有原來的幾分之一甚至更小。當然,壓縮包已經是另一種文件格式了,如果你想使用其中的數據,首先得用壓縮軟體把數據還原,這個過程稱作解壓縮。常見的壓縮軟體有winzip、winrar等。

『貳』 壓縮器的工作原理

壓縮器(Compressor)的主要功能是衰減強度超過了給定門限的強信號,減小了信號的動態范同;而擴展器(Expander)則是衰減強度小於給定門限的弱信號,增加了信號的動態范圍。顯然這里壓縮、擴展是對應信號的動態范圍改變而言的,因此它們有時被稱為「動態范圍處理器」。 [2]
從本質上講,壓縮器(Compressor)是一種自動音量控制設備,能夠減小聲音的動態范圍。在現有的錄音棚中,壓縮器幾乎是必要沒備。壓縮器的面板上有幾個重要的控制參數,其中之一是閥值。簡單地說,閥值是允許用戶自由指定的一個臨界電平值,當輸入電平高於這個值的時候,壓縮器才開始工作。如果輸入信號的電平低於閥值,那麼壓縮器就會自動停止。因此,這里傳達出的一個重要信息就是壓縮器並不是一直都處於工作狀態的(特殊情況除外)。如果輸入信號電平過低,將永遠不會達到壓縮閾值;如果輸入信號電平過高,壓縮器將嚴重製約信號的動態范圍,影響聲音在動態上的表現。壓縮比決定壓縮器的壓縮強度,換句話說它代表的是壓縮器將壓低多少超過閥值的音頻信號。例如,5:1的壓縮比意味著,如果輸人信號在當前的基礎上增加到10倍.那麼輸出信號的電平相應地只增加到兩倍。
另外兩個重要的參數分別是建立時問和釋放時問。建立時間指的是,當輸人信號超過閾值後壓縮器由啟動到正常壓縮狀態所用的時間;釋放時間指的是,當輸人信號下降到閾值之下後壓縮器由壓縮狀態恢復到不工作狀態所需要的時間。釋放時間是一個至關重要的參數,因為如果將釋放時間設置得過大,就會產生泵音效應,尤其當前一個音較響而後一個音較弱時,這種現象尤為明顯。

『叄』 winrar的壓縮原理

文件在硬碟中是以0和1的形式存儲的。比如說一個文件的內容是11100000000...000001111(中間有一萬個零),你要完全寫出來的話,會很長很長,但如果你寫「111一萬個零1111」來描述它,也能得到同樣的信息,但卻只有十一個字,這樣就減小了文件體積。在具體應用中很少有這樣的文件存在,那些文件都相當復雜,根據一定的數學演算法,權衡把哪段位元組用一個特定的更小位元組代替,就可以實現數據最大程度的無損壓縮.
.jpg.mp3等文件已經經過了編碼壓縮或者霍夫曼壓縮,沒有再壓縮的潛力了。

『肆』 壓縮文件的原理

大概是這樣的
計算機都是2進制的
表示為00000111010
壓縮就是把前面的00000
壓縮
計為多少我忘記了
111也是這樣的原理
老師給我們說的

『伍』 文件壓縮的原理是什麼

電腦里文件都是以二進制儲存的。壓縮原理就是通過特定的演算法,將文件轉化,而轉化以後的文件佔用的空間較小。

舉個簡單得例子(當然這個例子應該有點問題,但是能說明問題):
原始文件:111110000001
演算法:當連續同樣的1或者0的個數超過5個,則將其轉化成XX1或者XX0得形式;如果不超過5個,保持不變。XX是連續的1或者0的個數,如果連續數量較多,XX得位數可以增加。

於是11111可以表示成5個1,寫成二進制就是1011;000000可以表示成6個0,寫成二進制就是1100;而1保持不變。

這樣,轉化以後的文件就變成了101111001

可見,原始文件需要12個存儲位置,而轉化後的文件只需要9個存儲位置。

當然,實際上壓縮得演算法多種多樣,要比這個例子復雜的多。根據文件種類的不同壓縮演算法也經常不同。

『陸』 文件壓縮軟體的工作原理是什麼

計算機處理的信息是以二進制數的形式表示的,因此壓縮軟體就是把二進制信息中相同的字元串以特殊字元標記來達到壓縮的目的。為了有助於理解文件壓縮,請您在腦海里想像一幅藍天白雲的圖片。對於成千上萬單調重復的藍色像點而言,與其一個一個定義「藍、藍、藍……」長長的一串顏色,還不如告訴電腦:「從這個位置開始存儲1117個藍色像點」來得簡潔,而且還能大大節約存儲空間。這是一個非常簡單的圖像壓縮的例子。其實,所有的計算機文件歸根結底都是以「1」和「0」的形式存儲的,和藍色像點一樣,只要通過合理的數學計算公式,文件的體積都能夠被大大壓縮以達到「數據無損稠密」的效果。總的來說,壓縮可以分為有損和無損壓縮兩種。如果丟失個別的數據不會造成太大的影響,這時忽略它們是個好主意,這就是有損壓縮。有損壓縮廣泛應用於動畫、聲音和圖像文件中,典型的代表就是影碟文件格式MPEG、音樂文件格式MP3和圖像文件格式JPG。
壓縮原理
很多人都驚異於壓縮技術的神奇,一個文件被壓縮成一半大小,何以能無損還原呢?
早期使用的壓縮技術都基於統計模型,到20世紀80年代初基於字典壓縮的新技術才慢慢推廣開來。
數據壓縮包含了非常多的軟體和硬體技術,這些技術各不相同,但是大多數壓縮軟體都是基於LZ77、LZ88演算法並加以修正而成,而LZ77是字典壓縮的起源。大家都知道一個文本文件是由一些單片語成,而且必定有重復現象發生,例如我們這里經常出現的「壓縮軟體」一詞,壓縮的原理就是在文件的頭部做一個類似字典的東西,把「壓縮軟體」這個詞放在「字典」中,並為這個詞指定一個占較少位元組數的編碼,而文章中的「壓縮軟體」一詞均用此編碼代替,以達到壓縮的目的。當然壓縮軟體在實際運作中並非如此簡單,還要使用一些看了就頭痛的演算方法,在此就不一一細述。也許有人會問,文本文件可用字典技術,那其它文件怎麼辦呢。這就無須操心了,因為對於壓縮軟體來說,一個文件中的「數據壓縮」一詞和「@#¥%^」是一樣的,關鍵在於冗餘碼(重復部分)的多少。
壓縮常識
按壓縮方式分:有所謂的「透明壓縮」和「打包壓縮」。
「透明壓縮」一般針對.exe和.com文件,直接壓縮。成功的話,文件體積變小,功能不變,運行速度還可能更快。但是,這種壓縮方法的對象面很窄。如果壓縮失敗,還會造成文件不可用。所以,這一類程序總是強烈要求用戶在壓縮前將文件備份。
「打包壓縮」就是現在常提到的壓縮軟體使用的壓縮法。它把一個或多個文件壓縮成一個文件——壓縮包。要使用壓縮後的文件,必須先解壓將文件復原。它的特點是風險小,適用於減小不常用的文件所佔空間和傳輸數據。當然,按照壓縮演算法,我們還可以將壓縮分成很多種。
一般我們在談到壓縮時,會提到許多相關術語,下面我們就提出一些常見的術語進行解釋。
壓縮格式:壓縮文件時使用的壓縮編碼方法不同,壓縮生成的文件結構就不同,這種壓縮文件結構就稱壓縮格式。
壓縮比率:文件壓縮後佔用的磁碟空間與原文件的比率稱壓縮比率。在常用的壓縮格式中,RAR格式壓縮比率較高,ZIP格式較低。但ZIP格式的文件操作速度較快。
解壓:將壓縮文件還原為本來的文件格式,也稱釋放、擴展。
壓縮包:一般將通用壓縮格式的文件稱為壓縮包,如ZIP格式壓縮文件。這種文件可以在壓縮工具的管理下對包中壓縮的文件進行管理,如查看、刪除、添加等。
打包:將文件壓縮成通用壓縮格式的壓縮包文件稱為打包,也指將文件壓縮添加到壓縮包。
多卷壓縮:將壓縮的文件包分成幾個壓縮文件稱為多卷壓縮,一般是為了將壓縮文件儲存在多個軟磁碟上或方便網上傳輸。
自解壓文件:將文件壓縮生成可執行的文件,然後在沒有壓縮工具的幫助下,通過執行壓縮的文件,就可將自己的源文件解壓還原出來。
壓縮文件格式
目前流行著多種壓縮文件格式,下面我們就來看看到底有哪些吧!
ZIP:目前最流行的壓縮文件格式(在Internet上,ZIP文件已經取得了絕對勝利。在日常操作中,除專門的壓縮軟體之外,許多文件管理程序,如WindowsCommander等也都支持ZIP格式)。我們可利用WinZip對ZIP文件進行解壓、釋放等操作,還可以用它來處理ARJ、ARC、CAB、LZH等多種不同格式的壓縮文件,從而大大地方便了用戶的操作。
RAR:是一種高效快速的文件壓縮格式,但不被大多數文件壓縮程序支持,WinRAR是在Windows下處理RAR格式文件的最好工具。
ARJ:由DOS下曾經紅極一時的壓縮軟體ARJ壓縮而成的文件格式,它具有功能強大、壓縮率高等優點。到了現在的Windows時代,它已經沒有了往日的輝煌。
CAB:是Windows98新增的一種特殊壓縮文件格式,主要用於對有關軟體安裝盤中的文件進行壓縮,其特點是壓縮率非常高(可能是目前最高的),但一經壓縮就不能再進行任何增加、刪除、替換等修改,也就是說它的壓縮包具有「只讀」屬性。我們也可使用WinZip對CAB壓縮包進行操作。
??_:軟體安裝盤所採用的一種壓縮文件方式,如*.ex_、*.dl_、*.d3_等,它們一般由系統直接解壓並完成安裝工作,無須用戶操心。當然,我們也可使用DOS的EXPAND命令對*.??_文件進行釋放操作。
UU/UUE:漢字編碼方式,它們原本是Unix系統中使用的一種編碼方式,後來被改寫到DOS中,我們在傳送中文郵件時只須事先使用該方式進行編碼,此後就能順利通過只能處理7位編碼的郵件伺服器,從而解決了漢字的傳輸問題。
ACE:一種新式的壓縮程序,壓縮比很高。
另外,MP3、MPEG、JPG等音頻、視頻、圖像格式的文件也都採用了壓縮技術,從理論上來說它們也應該算壓縮文件,不過它們所採用的壓縮方式並不相同,這里簡單地介紹一下:
JPEG:JPEG全名為JointPhotographicExpertsGroup,它是一個在國際標准組織(ISO)下從事靜態影像壓縮標准制定的委員會。它制定出了第一套國標靜態影像壓縮標准:ISO10918-1就是我們俗稱的JPEG了。由於JPEG優良的品質,使得它在短短的幾年內就獲得極大的成功,目前網站上80%的影像都是採用JPEG的壓縮標准。
JPEG2000:正式名稱為「ISO15444」,同樣是由JPEG組織負責制定。JPEG2000與傳統JPEG最大的不同,在於它放棄了JPEG所採用的以離散餘弦轉換為主的區塊編碼方式,而改以小波轉換為主的多解析編碼方式。其壓縮率比JPEG高約30%左右,同時支持有損和無損壓縮,無損壓縮對保存一些重要圖片十分有用。
MP3:這個大家應該都認識它了,MP3全稱是MPEG1Layer3,是一種高性能的聲音壓縮編碼方案,它可以做出超小「體積」的音樂文件,大小隻是原始音頻數據的1/10到1/12。但人耳聽起來,效果卻沒有太大差異。它一出世就幾乎佔領了電腦音樂領域,由於MP3的出現,過去在網際網路上半小時才能下載完的一首歌曲,現在以MP3格式僅需短短的幾分鍾就可以「搞定」。
MPEG:MPEG是MovingPicturesExpertsGroup(動態圖像專家組)的縮寫。
現在使用的有4個版本:MPEG-1、MPEG-2、MPEG-3、MPEG-4。

『柒』 壓縮文件是什麼原理

壓縮的原理:計算機處理信息是以二進制數(0和1)的形式標示的,壓縮軟體把二進制信息中相同的字元串以特殊字元標記起來壓縮的,從而實現縮小文件大小的。
文件的壓縮比則根據文件的類型不同有所不同,比如文檔類的文件壓縮比很大(一個字或者一個詞在同一個文件會反復出現),而圖形圖像的壓縮比則比較小(每一個像素點的色素不同是常有的,不同顏色和顏色深淺、對比度的不同、亮度不同等的對應二進制代碼是不同的)。
如果原文件被刪掉了,只要將壓縮文件解壓就可以。
回答者

『捌』 壓縮軟體的原理是什麼

計算機處理的信息是以二進制數的形式表示的,因此壓縮軟體就是把二進制信息中相同的字元串以特殊字元標記來達到壓縮的目的。為了有助於理解文件壓縮,請您在腦海里想像一幅藍天白雲的圖片。對於成千上萬單調重復的藍色像點而言,與其一個一個定義「藍、藍、藍……」長長的一串顏色,還不如告訴電腦:「從這個位置開始存儲1117個藍色像點」來得簡潔,而且還能大大節約存儲空間。這是一個非常簡單的圖像壓縮的例子。其實,所有的計算機文件歸根結底都是以「1」和「0」的形式存儲的,和藍色像點一樣,只要通過合理的數學計算公式,文件的體積都能夠被大大壓縮以達到「數據無損稠密」的效果。總的來說,壓縮可以分為有損和無損壓縮兩種。如果丟失個別的數據不會造成太大的影響,這時忽略它們是個好主意,這就是有損壓縮。有損壓縮廣泛應用於動畫、聲音和圖像文件中,典型的代表就是影碟文件格式MPEG、音樂文件格式MP3和圖像文件格式JPG。

壓縮原理
很多人都驚異於壓縮技術的神奇,一個文件被壓縮成一半大小,何以能無損還原呢?

早期使用的壓縮技術都基於統計模型,到20世紀80年代初基於字典壓縮的新技術才慢慢推廣開來。

數據壓縮包含了非常多的軟體和硬體技術,這些技術各不相同,但是大多數壓縮軟體都是基於LZ77、LZ88演算法並加以修正而成,而LZ77是字典壓縮的起源。大家都知道一個文本文件是由一些單片語成,而且必定有重復現象發生,例如我們這里經常出現的「壓縮軟體」一詞,壓縮的原理就是在文件的頭部做一個類似字典的東西,把「壓縮軟體」這個詞放在「字典」中,並為這個詞指定一個占較少位元組數的編碼,而文章中的「壓縮軟體」 一詞均用此編碼代替,以達到壓縮的目的。當然壓縮軟體在實際運作中並非如此簡單,還要使用一些看了就頭痛的演算方法,在此就不一一細述。也許有人會問,文本文件可用字典技術,那其它文件怎麼辦呢。這就無須操心了,因為對於壓縮軟體來說,一個文件中的「數據壓縮」一詞和「@#¥%^」 是一樣的,關鍵在於冗餘碼(重復部分)的多少。

壓縮常識
按壓縮方式分:有所謂的「透明壓縮」和「打包壓縮」。

「透明壓縮」一般針對.exe和.com文件,直接壓縮。成功的話,文件體積變小,功能不變,運行速度還可能更快。但是,這種壓縮方法的對象面很窄。如果壓縮失敗,還會造成文件不可用。所以,這一類程序總是強烈要求用戶在壓縮前將文件備份。

「打包壓縮」就是現在常提到的壓縮軟體使用的壓縮法。它把一個或多個文件壓縮成一個文件——壓縮包。要使用壓縮後的文件,必須先解壓將文件復原。它的特點是風險小,適用於減小不常用的文件所佔空間和傳輸數據。當然,按照壓縮演算法,我們還可以將壓縮分成很多種。

一般我們在談到壓縮時,會提到許多相關術語,下面我們就提出一些常見的術語進行解釋。

壓縮格式:壓縮文件時使用的壓縮編碼方法不同,壓縮生成的文件結構就不同,這種壓縮文件結構就稱壓縮格式。

壓縮比率:文件壓縮後佔用的磁碟空間與原文件的比率稱壓縮比率。在常用的壓縮格式中,RAR格式壓縮比率較高,ZIP格式較低。但ZIP格式的文件操作速度較快。

解壓:將壓縮文件還原為本來的文件格式,也稱釋放、擴展。

壓縮包:一般將通用壓縮格式的文件稱為壓縮包,如ZIP格式壓縮文件。這種文件可以在壓縮工具的管理下對包中壓縮的文件進行管理,如查看、刪除、添加等。

打包:將文件壓縮成通用壓縮格式的壓縮包文件稱為打包,也指將文件壓縮添加到壓縮包。

多卷壓縮:將壓縮的文件包分成幾個壓縮文件稱為多卷壓縮,一般是為了將壓縮文件儲存在多個軟磁碟上或方便網上傳輸。

自解壓文件:將文件壓縮生成可執行的文件,然後在沒有壓縮工具的幫助下,通過執行壓縮的文件,就可將自己的源文件解壓還原出來。

壓縮文件格式
目前流行著多種壓縮文件格式,下面我們就來看看到底有哪些吧!

ZIP:目前最流行的壓縮文件格式(在Internet上,ZIP文件已經取得了絕對勝利。在日常操作中,除專門的壓縮軟體之外,許多文件管理程序,如Windows Commander等也都支持ZIP格式)。我們可利用WinZip對ZIP文件進行解壓、釋放等操作,還可以用它來處理ARJ、ARC、CAB、LZH等多種不同格式的壓縮文件,從而大大地方便了用戶的操作。

RAR:是一種高效快速的文件壓縮格式,但不被大多數文件壓縮程序支持,WinRAR是在Windows下處理RAR格式文件的最好工具。

ARJ:由DOS下曾經紅極一時的壓縮軟體ARJ壓縮而成的文件格式,它具有功能強大、壓縮率高等優點。到了現在的Windows時代,它已經沒有了往日的輝煌。

CAB:是Windows 98新增的一種特殊壓縮文件格式,主要用於對有關軟體安裝盤中的文件進行壓縮,其特點是壓縮率非常高(可能是目前最高的),但一經壓縮就不能再進行任何增加、刪除、替換等修改,也就是說它的壓縮包具有「只讀」屬性。我們也可使用WinZip對CAB壓縮包進行操作。

??_:軟體安裝盤所採用的一種壓縮文件方式,如*.ex_、*.dl_、*.d3_等,它們一般由系統直接解壓並完成安裝工作,無須用戶操心。當然,我們也可使用DOS的EXPAND命令對*.??_文件進行釋放操作。

UU/UUE:漢字編碼方式,它們原本是Unix系統中使用的一種編碼方式,後來被改寫到DOS中,我們在傳送中文郵件時只須事先使用該方式進行編碼,此後就能順利通過只能處理7位編碼的郵件伺服器,從而解決了漢字的傳輸問題。

ACE:一種新式的壓縮程序,壓縮比很高。

另外,MP3、MPEG、JPG等音頻、視頻、圖像格式的文件也都採用了壓縮技術,從理論上來說它們也應該算壓縮文件,不過它們所採用的壓縮方式並不相同,這里簡單地介紹一下:

JPEG:JPEG 全名為 Joint Photographic Experts Group,它是一個在國際標准組織(ISO)下從事靜態影像壓縮標准制定的委員會。它制定出了第一套國標靜態影像壓縮標准:ISO 10918-1 就是我們俗稱的JPEG了。由於JPEG優良的品質,使得它在短短的幾年內就獲得極大的成功,目前網站上80%的影像都是採用JPEG的壓縮標准。

JPEG 2000:正式名稱為「ISO 15444」,同樣是由JPEG 組織負責制定。JPEG 2000與傳統 JPEG 最大的不同,在於它放棄了JPEG所採用的以離散餘弦轉換為主的區塊編碼方式,而改以小波轉換為主的多解析編碼方式。其壓縮率比 JPEG高約30%左右,同時支持有損和無損壓縮,無損壓縮對保存一些重要圖片十分有用。

MP3:這個大家應該都認識它了,MP3全稱是MPEG 1 Layer 3,是一種高性能的聲音壓縮編碼方案,它可以做出超小「體積」的音樂文件,大小隻是原始音頻數據的1/10到1/12。但人耳聽起來,效果卻沒有太大差異。它一出世就幾乎佔領了電腦音樂領域,由於MP3的出現,過去在網際網路上半小時才能下載完的一首歌曲,現在以MP3格式僅需短短的幾分鍾就可以「搞定」。

MPEG:MPEG是Moving Pictures Experts Group(動態圖像專家組)的縮寫。
現在使用的有4個版本:MPEG-1、MPEG-2、MPEG-3、MPEG-4。

閱讀全文

與壓縮原理相關的資料

熱點內容
租個伺服器開個私服需要什麼 瀏覽:270
圖片換成pdf格式 瀏覽:661
javamidi編程 瀏覽:831
android60demo 瀏覽:65
頭條演算法怎麼復習 瀏覽:512
燈光控制通道可以編程設置嗎 瀏覽:781
webpack命令行 瀏覽:805
卸載雲伺服器操作系統 瀏覽:29
java文件移動文件夾 瀏覽:449
針織公斤足稱演算法 瀏覽:457
電腦下載的圖片從文件夾重新編組 瀏覽:645
安卓源碼編譯引導失敗 瀏覽:676
蘋果怎麼添加自定義app文件夾 瀏覽:930
橙牛app怎麼找客服 瀏覽:307
php對象魔術方法 瀏覽:487
OBV能量潮幅圖指標源碼 瀏覽:915
編程15個好習慣 瀏覽:676
電腦u盤文件夾顯示屏幕保護程序 瀏覽:803
我的世界伺服器版本怎麼下載 瀏覽:600
c代碼加密工具 瀏覽:359