『壹』 什麼是壓縮為什麼要壓縮
為什麼要壓縮?
我們可以從壓縮的歷史談起。
早期的電腦無論是硬碟空間還是磁碟空間都小得可憐。比如93年的時候,一台0.5GB空間的硬碟的個人電腦在國內就已經算是海量空間了。
那個時候,普遍使用磁碟(如3寸盤,就是現在仍常見磁碟,對應電腦上的A驅驅動器;5寸盤,現在已經被淘汰,對應電腦上的B區驅動器。現在的電腦為什麼只有A盤,沒有B盤,接著就到了C盤就是這個原因)作為外部存儲介質。
眾所周知,一張軟盤的存儲量只有1.44MB,容量非常小。在光碟還沒有誕生的時候,一些游戲、軟體要安裝的話往往需要很多軟盤。我至今還有一套那時候的軒轅劍2的游戲,共有20餘張磁碟,安裝時要挨個磁碟安裝,非常麻煩。
因為容量的限制,促使各程序員開始開發各種壓縮軟體對軟體進行壓縮。其實與壓縮相關的有兩道程序,第一道程序是壓縮,第二道程序則是解壓縮。
軟體壓縮的原理:在電腦中,一切東西都是數字的,聲音也好、圖像也好,軟體也好,實際上通通都只是一些二進制代碼,所謂數碼數碼,數碼相片、數碼音頻,也是這個道理。
所謂壓縮,以數碼圖片為例,就是將把要壓縮的圖像的二進制代碼中冗長的、重復的代碼遵循一定的演算法用簡短的代碼來代替。比如00002可能代表的是「黑色」,那麼我們可以將軟體中凡是涉及「黑色」的代碼的00002通過02來替換,這樣02比起00002是不是占的空間要小?省了好幾個字元空間呢。這里僅是一個例子,軟體中的冗長的、重復的代碼如果都按一定的演算法用簡短的代碼來替換的話,最後重新生成的軟體一定會小得多。這個重新生成圖片,就是壓縮後的圖片。這個過程,就叫做壓縮。
圖片如此,軟體、音頻、視頻亦是如此。
至於演算法,則是固定的,壓縮軟體既包括演算法資料庫,又包括壓縮功能。所以,一台電腦只需要一個壓縮軟體就夠了,要壓縮其它資源就由這個壓縮軟體完成。
一般而言,被壓縮的文件是不能直接運行的,那是因為它的代碼都被簡化了,計算機是不能直接識別的。被壓縮了的文件只是變小了空間而已,是不能直接使用的。
要想再使用這些壓縮過的文件,你必須解壓縮。
解壓縮這些文件還是要用到對應的壓縮它們的壓縮軟體。解壓縮的過程正好和壓縮的過程相反。同樣是通過一定的演算法,將簡短的代碼還原回程序的真正的代碼,這樣程序的大小會恢復到壓縮前的大小,解壓後的文件也就可以正常使用。(很多朋友可能會說WINRAR壓縮的文件是可以直接使用的,不過如果你仔細觀察,運行一個程序會看到一個進度條,還要等一段時間才能運行,這個過程實際上就是一個解壓的過程,只不過它是把文件自動解壓到了一個不容易找到的臨時文件夾,你看不到這些解壓後的文件而已)。
文件經過壓縮後,所佔空間會大大減小,有的壓縮軟體可以讓軟體的大小減少一半,有的壓縮軟體甚至能將軟體壓縮至原先大小的六分之一。
壓縮技術另一個發展高潮是在互聯網剛剛興起和剛剛引進我國的時候。那個時候因為網速非常慢,所以人們自然希望在網上下載的軟體越小越好,因為越小花的時間就越少,花的上網費也就越少。
不僅如此,至今你都會發現各大網站提供的軟體多是壓縮過了的,壓縮過的文件大小變小,自然比原文件下載起來快。
文件下載下來後,你再通過你已經安裝過的壓縮軟體運行就OK了。
是的,沒有對應的壓縮軟體的話,你下載下來的被壓縮軟體也是沒有用的。
現在,隨著數碼技術的發展,壓縮技術也在不斷發展,因為硬碟和光碟的空間畢竟是有限的,而游戲、音頻、視頻、圖片遠遠非常占據空間,所以壓縮技術前景非常廣闊並且不斷在發展。
『貳』 壓縮包是什麼與文件夾有什麼區別
文件夾是把一定的文件放在一起以便於管理,比如文件夾「MP3」,那你的裡面肯定會放上音樂、鈴聲...不然的話,那這些音樂、鈴聲就會分散在電腦里,很不好找。
而壓縮包則是把一些文件壓縮在一起,使用時解一下壓,不僅容量變小並且便於上傳和管理。譬如你下載了一個壓縮包,使用解壓後的文件,但後來被自己誤刪了某個文件導致程序不可用,那你就可以用壓縮包再次進行解壓並覆蓋原文件即可,不必再重新下載了;尤其是一些大的文件,重新下載很耗時,有了壓縮包可省事了。
壓縮包作用:
1、節省磁碟空間;
2、可以把多個文件壓縮成一個壓縮包,此功能在發送郵件時用處比較大,因為郵件附件多個文件通常要一個個的上傳,把多個文件壓縮成一個壓縮包後就可以完成一次上傳了;
3、可以把一個大文件分解壓縮成多個小壓縮包,此功能在文件拷貝中作用比較大,比如所你現在有個300M的文件需要拷貝到別的電腦中,而你的優盤只有256M,這時候你就可以用壓縮軟體把文件分成兩個150M的壓縮包然後分別拷貝就行了;
4、此外部分軟體如WinRAR可以實現對文件的壓縮保密保護,就是在形成壓縮包的時候添加解壓密碼,這樣生成的壓縮包別人沒有密碼是無法打開的,可以起到一定的文件保密作用。
『叄』 壓縮文件是什麼意思
簡單的說,就是經過壓縮軟體壓縮的文件叫壓縮文件,壓縮的原理是把文件的二進制代碼壓縮,把相鄰的0,1代碼減少,比如有000000,可以把它變成6個0
的寫法60,來減少該文件的空間。
■怎麼壓縮文件?
首先要安裝壓縮軟體,現在比較流行的是WinRAR「一種高效快速的文件壓縮軟體(中文版)」。
其次是建立一個壓縮包:選擇你要製作成壓縮包的文件或文件夾,當然你也可也多選,方法同資源管理器,也就是按住Ctrl或Shift再選擇文件(文件夾)。
選取完畢之後,就可以單擊工具欄上的「壓縮」按鈕,在這里你可以選擇壓縮格式:RAR和ZIP。
如果你想得到較大的壓縮率,建議選擇RAR格式。
各個選項選擇好以後,單擊確定按鈕就開始製作壓縮包了,非常方便。
有時候大家會遇到這個問題,就是你在一個論壇里要上傳一些文件壓縮包,壓縮包大小有3M,但是論壇限制會員上傳大小隻有2M,怎麼辦呢?
其實辦法很簡單,就是在你壓縮這個文件時,分成幾個帶分卷壓縮包,分卷包大小設置為2M即可,比如:原來文件名為123.rar(3M),壓縮成分卷包後為123.part1.rar(2M)與123.part2.rar(1M)兩個文件,這樣你就可以上傳了。
具體方法如下:
1、在要壓縮的文件上點右鍵
2、添加到壓縮文件....
3、選常規
4、壓縮方式選最好
5、批定壓縮分卷大小(按位元組計算),1M
=
1024K,1K
=
1024位元組,填寫數字即可
當你下載了帶有分卷的壓縮包後,如何解壓文件呢?
具體方法如下:
1、把所有的壓縮分卷全部下載完整
2、所有分卷必須在同一個文件夾內
3、然後雙擊解壓第一個分卷,即可
註:分卷解壓的文件必須是連續的,若分卷未下載完整,則解壓時自然會提示需要下一壓縮分卷
TOMMY
貢士
最佳答案
-
由投票者8個月前選出
壓縮工具
WinRAR,流行好用的
Windows
壓縮工具
WinRAR
是一個強大的壓縮文件管理工具。它能備份你的數據,減少你的
E-mail
附件的大小,解壓縮從Internet上下載的
RAR、ZIP
和其他格式的壓縮文件,並能創建
RAR
和
ZIP
格式的壓縮文件。在購買之前,你可以下載試用版本。
軟體介紹
WINRAR
是目前流行的壓縮工具,界面友好,使用方便,在壓縮率和速度方面都有很好的表現。其壓縮率比高,3.x
採用了更先進的壓縮演算法,是現在壓縮率較大、壓縮速度較快的格式之一。
3.3
增加了掃描壓縮文件內病毒、解壓縮「增強壓縮」
ZIP
壓縮文件的功能,
升級了分卷壓縮的功能等。
主要特點:
1、
對
RAR
和
ZIP
的完全支持;
2、
支持
ARJ、CAB、LZH、ACE、TAR、GZ、UUE、BZ2、JAR、ISO
類型文件的解壓;
3、
多卷壓縮功能;
4、
創建自解壓文件,可以製作簡單的安裝程序,使用方便;
5、
壓縮文件大小可以達到
8,589,934
TB;
6、
鎖定和強大的數據恢復記錄功能,對數據的保護無微不至,新增的恢復卷的使用功能更強大
『肆』 壓縮文件是什麼意思
RAR是一種文件壓縮與歸檔的私有文件格式,用於數據壓縮與歸檔打包,簡單的說就是將原有的文件數據經過壓縮處理之後保存為RAR文件格式後綴名,通常Windows用戶比較常見的壓縮軟體WinRAR,通過使用WinRAR對文件數據進行壓縮後默認保存的文件格式就是RAR格式。
RAR 是一種專有的文件格式,用於文件的壓縮、歸檔與打包。RAR 的全名是:Roshal Archive(即「羅謝爾的歸檔」之意),其開發者是尤金·羅謝爾(Eugene Roshal)。首個公開版本 RAR 1.3 發布於1993年。
(4)壓縮的是什麼東西擴展閱讀
運行原理
從互聯網上下載了許多程序和文件,可能會遇到很多ZIP文件。這種壓縮機制是一種很方便的發明,尤其是對網路用戶,因為它可以減小文件中的比特和位元組總數,使文件能夠通過較慢的互聯網連接實現更快傳輸,此外還可以減少文件的磁碟佔用空間。
在下載了文件後,計算機可使用WinZip或Stuffit這樣的程序來展開文件,將其復原到原始大小。如果一切正常,展開的文件與壓縮前的原始文件將完全相同。
『伍』 壓縮和解壓到底是什麼意思
壓縮的意思是像壓縮餅干那樣,將數據所需的存儲空間縮小,增大硬碟的可用空間。
解壓:與壓縮相對應,我們壓縮後的文件是不能正常打開使用的,必須先進行解壓,然後才能正常被我們所使用。
『陸』 壓縮是什麼意思
一堆衣服攤在床上,很亂,佔得空間很大
你用壓縮工具把衣服疊起來,很整齊,空間佔用變小
像電腦這樣的衣櫃就可以裝下更多的文件
『柒』 手機壓縮包是什麼意思,那些東西可以刪除嗎
壓縮包就是把文件壓縮之後的文件。
壓縮包的基本原理是查找文件內的重復位元組,並建立一個相同位元組的「詞典」文件,並用一個代碼表示,比如在文件里有幾處有一個相同的詞「中華人民共和國」,用一個代碼表示並寫入「詞典」文件,這樣就可以達到縮小文件的目的。
二、壓縮包簡介:
1、壓縮包,比普通的文件佔用的空間小。比如普通文件佔1M空間,通過壓縮壓成壓縮包後,可能只佔100K空間。
2、壓縮包里是文件。打開壓縮包看一下,如果裡面的文件沒用,就刪掉,有用就留下。
3、壓縮包里的文件肯定不是應用程序,都是文檔、圖片等。是由用戶自己決定刪除不刪除的。
壓縮包的原理:
如果從互聯網上下載了許多程序和文件,可能會遇到很多壓縮文件。這種壓縮機制是一種很方便的發明,尤其是對網路用戶,因為它可以減小文件中的比特和位元組總數,使文件能夠通過較慢的互聯網連接實現更快傳輸,此外還可以減少文件的磁碟佔用空間。在下載了文件後,計算機可使用WinRar或Stuffit這樣的程序來展開文件,將其復原到原始大小。如果一切正常,展開的文件與壓縮前的原始文件將完全相同。壓縮包是計算機壓縮文件、文件夾的載體。
無論是什麼壓縮軟體,其目的就只有一個:減少冗餘數據。例如某行字是「000011111」,就可以壓縮為「0(4)1(5)」,在保證數據沒有受損的同時,減少其佔用的體積。
『捌』 什麼是壓縮文件
簡單的說,就是經過壓縮軟體壓縮的文件叫壓縮文件,壓縮的原理是把文件的二進制代碼壓縮,把相鄰的0,1代碼減少,比如有000000,可以把它變成6個0 的寫法60,來減少該文件的空間。安裝壓縮軟體首先要安裝壓縮軟體,現在比較流行的是WinRAR「一種高效快速的文件壓縮軟體(中文版)」。 在要壓縮的文件上點右鍵其次是建立一個壓縮包:選擇你要製作成壓縮包 WinRAR壓縮文件的文件或文件夾,當然你也可也多選,方法同資源管理器,也就是按住Ctrl或Shift再選擇文件(文件夾)。 添加到壓縮文件.... 選常規選取完畢之後,就可以單擊工具欄上的「壓縮」按鈕,在這里你可以選擇壓縮格式:RAR和ZIP。 如果你想得到較大的壓縮率,建議選擇RAR格式。 各個選項選擇好以後,單擊確定按鈕就開始製作壓縮包了,非常方便。 批定壓縮分卷大小( 按位元組計算),1M = 1024K,1K = 1024位元組,填寫數字即可。 有時候大家會遇到這個問題,就是你在一個論壇里要上傳一些文件壓縮包,壓縮包大小有3M,但是論壇限制會員上傳大小隻有2M,怎麼辦呢? 其實辦法很簡單,就是在你壓縮這個文件時,分成幾個帶分卷壓縮包,分卷包大小設置為2M即可,比如:原來文件名為123.rar(3M),壓縮成分卷包後為123.part1.rar(2M)與123.part2.rar(1M)兩個文件,這樣你就可以上傳了。 編輯本段怎麼解壓縮文件?當你下載了帶有分卷的壓縮包後,如何解壓文件呢? Zip壓縮文件具體方法如下: 1、把所有的壓縮分卷全部下載完整 2、所有分卷必須在同一個文件夾內 3、然後雙擊解壓第一個分卷,即可註:分卷解壓的文件必須是連續的若分卷未下載完整,則解壓時自然會提示需要下一壓縮分卷 編輯本段WINRAR軟體介紹WinRAR,流行好用的 Windows 壓縮工具! WinRAR 是一個強大的壓縮文件管理工具。它能備份你的數據,減少你的 E-mail 附件的大小,解壓縮從Internet上下載的 RAR、ZIP 和其他格式的壓縮文件,並能創建 RAR 和 ZIP 格式的壓縮文件。在購買之前,你可以下載試用版本。 WINRAR 是目前流行的壓縮工具,界面友好,使用方便,在壓縮率和速度方面都有很好的表現。其壓縮率比高,3.x 採用了更先進的壓縮演算法,是現在壓縮率較大、壓縮速度較快的格式之一。 3.3 增加了掃描壓縮文件內病毒、解壓縮「增強壓縮」 ZIP 壓縮文件的功能, 升級了分卷壓縮的功能等。 編輯本段主要特點1、 對 RAR 和 ZIP 的完全支持; 2、 支持 ARJ、CAB、LZH、ACE、TAR、GZ、UUE、BZ2、JAR、ISO 類型文件的解壓; 3、 多卷壓縮功能; 4、 創建自解壓文件,可以製作簡單的安裝程序,使用方便; 5、 壓縮文件大小可以達到 8,589,934 TB; 6、 鎖定和強大的數據恢復記錄功能,對數據的保護無微不至,新增的恢復卷的使用功能更強大 編輯本段壓縮文件的運行原理有損壓縮和無損壓縮 無損壓縮如果您從互聯網上下載了許多程序和文件,可能會遇到很多ZIP文件。這種壓縮機制是一種很方便的發明,尤其是對網路用戶,因為它可以減小文件中的比特和位元組總數,使文件能夠通過較慢的互聯網連接實現更快傳輸,此外還可以減少文件的磁碟佔用空間。在下載了文件後,計算機可使用WinZip或Stuffit這樣的程序來展開文件,將其復原到原始大小。如果一切正常,展開的文件與壓縮前的原始文件將完全相同。 乍一聽好像很神秘:您是怎樣減少比特和位元組的數量並將它們原封不動地還原回去的呢?等一切水落石出之後,您會發現這個過程背後的基本理念其實非常簡單明了。在本文中,我們將討論這種通過簡單壓縮來明顯減小文件的方法。 大多數計算機文件類型都包含相當多的冗餘內容——它們會反復列出一些相同的信息。文件壓縮程序就是要消除這種冗餘現象。與反復列出某一塊信息不同,文件壓縮程序只列出該信息一次,然後當它在原始程序中出現時再重新引用它。 以我們熟悉的信息類型——單詞——為例子。 肯尼迪(John F. Kennedy)在1961年的就職演說中曾說過下面這段著名的話: Ask not what your country can do for you——ask what you can do for your country.(不要問國家能為你做些什麼,而應該問自己能為國家做些什麼。) 這段話有17個單詞,包含61個字母、16個空格、1個破折號和1個句點。如果每個字母、空格或標點都佔用1個內存單元,那麼文件的總大小為79個單元。為了減小文件的大小,我們需要找出冗餘的部分。 我們立刻發現: 如果忽略大小寫字母間的區別,這個句子幾乎有一半是冗餘的。九個單詞(ask、not、what、your、country、can、do、for、you)幾乎提供了組成整句話所需的所有東西。為了構造出另一半句子,我們只需要拿出前半段句子中的單詞,然後加上空格和標點就行了。 大多數壓縮程序使用基於自適應字典的LZ演算法來縮小文件。「LZ」指的是此演算法的發明者Lempel和Ziv,「字典」指的是對數據塊進行歸類的方法。 排列字典的機制有很多種,它也可以像編號列表那樣簡單。在我們檢查肯尼迪這句著名講話時,可以挑出重復的單詞,並將它們放到編號索引中。然後,我們直接寫入編號而不是寫入整個單詞。 因此,如果我們的字典是: ask what your country can do for you 我們的句子現在就應該是這樣的: 1 not 2 3 4 5 6 7 8-- 1 2 8 5 6 7 3 4 如果您了解這種機制,那麼只需使用該字典和編號模式即可輕松重新構造出原始句子。這就是在展開某個下載文件時,計算機中的解壓縮程序所做的工作。你可能還遇到過能夠自行解壓縮的壓縮文件。若要創建這種文件,編程人員需要在被壓縮的文件中設置一個簡單的解壓縮程序。在下載完畢後,它可以自動重新構造出原始文件。 但是使用這種機制究竟能夠節省多少空間呢?「1 not 2 3 4 5 6 7 8——1 2 8 5 6 7 3 4」當然短於「Ask not what your country can do for you-- ask what you can do for your country.」,但應注意的是,我們需要隨文件一起保存這個字典。 在實際壓縮方案中,計算出各種文件需求是一個相當復雜的過程。讓我們回過頭考慮一下上面的例子。每個字元和空格都佔用1個內存單元,整個原句要佔用79個單元。壓縮後的句子(包括空格)佔用了37個單元,而字典(單詞和編號)也佔用了37個單元。也就是說,文件的大小為74個單元,因此我們並沒有把文件大小減少很多。 但這只是一個句子的情況!可以想像的是,如果用該壓縮程序處理完肯尼迪講話的其餘部分,我們會發現這些單詞以及其他單詞重復了更多次。而且,正如下一節所言,為了得到盡可能高的組織效率,可以對字典進行重寫。 在上一個的例子中,我們挑出了所有重復的單詞並將它們放在一個字典中。對於我們來說,這是最顯而易見的字典編寫方法。但是壓縮程序卻不這樣認為:它對單詞沒有概念——它只會尋找各個模式。為了盡可能減小文件的大小,它會仔細挑選出最優模式。 如果從這個角度處理該句子,我們最終會得到一個完全不同的字典。 如果壓縮程序掃描肯尼迪的這句話,它遇到的第一個冗餘部分只有幾個字母長。在ask not what your中,出現了一個重復的模式,即字母t後面跟一個空格——在not和what中。如果壓縮程序將此模式寫入字典,則每次出現「t」後面跟一個空格的情況時,它會寫入一個「1」。但是在這個短句中,此模式的出現次數不夠多,不足以將其保留為字典中的一個條目,因此程序最終會覆蓋它。 程序接下來注意到的內容是ou,在your和country中都出現了它。如果這是一篇較長的文檔,將此模式寫入字典會節省大量空間——在英語中ou是一個十分常見的字母組合。但是在壓縮程序看完整個句子後,它立即發現了一個更好的字典條目選擇:不僅ou發生了重復,而且your和country整個單詞都發生了重復,並且它們實際上是作為一個短語your country一起發生重復的。在本例中,程序會用your country條目覆蓋掉字典中的ou條目。 短語can do for也發生了重復,一次後面跟著your,另一次跟著you,因此我們又發現can do for you也是一種重復模式。這樣,我們可以用一個數字來代替15個字元(包含空格),而your country只允許我們用一個數字代替13個字元(包含空格),所以程序會用r country條目覆蓋your country條目,然後再寫入一個單獨的can do for you條目。程序通過這種方式繼續工作,挑出所有重復的信息,然後計算應該將哪一種模式寫入字典。基於自適應字典的LZ演算法中的「自適應」部分指的就是這種重寫字典的能力。程序執行此工作的過程實際上非常復雜。 無論使用什麼方法,這種深入搜索機制都能比僅僅挑出單詞這種方法更有效率地對文件進行壓縮。如果使用我們上面提取出的模式,然後用「__」代替空格,最終將得到下面這個更大的字典: ask__ what__ you r__country __can__do__for__you 而句子則較短: 「1not__2345__--__12354」 句子現在佔用18個內存單元,字典佔用41個單元。所以,我們將文件總大小從79個單元壓縮到了59個單元!這僅僅是壓縮句子的一種方法,而且不一定是最高效的方法。(看看您能找到更好的方法嗎!) 那麼這種機制到底有多好呢?文件壓縮率取決於多種因素,包括文件類型、文件大小和壓縮方案。 在世界上的大多數語言中,某些字母和單詞經常以相同的模式一起出現。正是由於這種高冗餘性,而導致文本文件的壓縮率會很高。通常大小合適的文本文件的壓縮率可以達到50%或更高。大多數編程語言的冗餘度也很高,因為它們的命令相對較少,並且命令經常採用一種設定的模式。對於包含大量不重復信息的文件(例如圖像或MP3文件),則不能使用這種機制來獲得很高的壓縮率,因為它們不包含重復多次的模式。 如果文件有大量重復模式,那麼壓縮率通常會隨著文件大小的增加而增加。從我們的例子中就可以看出這一點——如果我們摘錄的肯尼迪講話再長一些,您會發現又多次出現了我們字典中的模式,因此能夠通過每個字典條目節省更多的文件空間。此外,對於更大的文件,還可能出現具有更大普遍性的模式,從而能夠創建出效率更高的字典。 此外,文件壓縮效率還取決於壓縮程序使用的具體演算法。有些程序能夠在某些類型的文件中更好地尋找到模式,因此能更有效地壓縮這些類型的文件。其他一些壓縮程序在字典中又使用了字典,這使它們在壓縮大文件時表現很好,但是在壓縮較小的文件時效率不高。盡管這一類的所有壓縮程序都基於同一個基本理念,但是它們的執行方式卻各不相同。程序開發人員始終在嘗試建立更好的壓縮機制。 有損壓縮我們在上文中討論的壓縮類型稱為無損壓縮,因為您重新創建的文件與原始文件完全相同。所有無損壓縮都基於這樣一種理念:將文件變為「較小」的形式以利於傳輸或存儲,並在另一方收到它後復原以便重新使用它。 有損壓縮則與此大不相同。這些程序直接去除「不必要」的信息,對文件進行剪裁以使它變得更小。這種類型的壓縮大量應用於減小點陣圖圖像的文件大小,因為點陣圖圖像的體積通常非常龐大。為了了解有損壓縮的工作原理,讓我們看看你的計算機如何對一張掃描的照片進行壓縮。 對於此類文件,無損壓縮程序的壓縮率通常不高。盡管圖片的大部分看起來都是相同的——例如,整個天空都是藍色的——但是大部分像素之間都存在微小的差異。為了使圖片變得更小同時不降低其解析度,您必須更改某些像素的顏色值。如果圖片中包含大量的藍色天空,程序會挑選一種能夠用於所有像素的藍色。然後,程序重寫該文件,所有天空像素的值都使用此信息。如果壓縮方案選擇得當,您不會注意到任何變化,但是文件大小會顯著減小。 當然,對於有損壓縮,在文件壓縮後您無法將其復原成原始文件的樣子。您必須接受壓縮程序對原始文件的重新解釋。因此,如果需要完全重現原來的內容(例如軟體應用程序、資料庫和總統就職演說),則不應該使用這種壓縮形式
『玖』 「winRAR壓縮文件」是什麼東西
就是由WinRAR軟體創建的壓縮文件。 以下內容來源於網路====================WinRAR是一個文件壓縮管理共享軟體,由Eugene Roshal(所以RAR的全名是:Roshal ARchive)開發。首個公開版本RAR 1.3發布於1993年。Pocket RAR是為Pocket PC平台發布的免費軟體。它是僅有的幾個可以讀寫RAR文件的軟體之一,因為它保留版權。 Eugene Roshal,1972年3月10日生於俄羅斯。畢業於俄羅斯車里雅賓斯克工業大學(Chelyabinsk Technical University),也是FAR文件管理器的作者。他開發程序壓縮/解壓RAR文件,最初用於DOS,後來移植到其它平台。主要的Windows版本編碼器,稱為WinRAR,以共享軟體的形式發行。不過Roshal公開了解碼器源碼,UnRAR解碼器許可證允許有條件自由發布與修改(條件:不許發布編譯RAR兼容編碼器)。而RAR編碼器一直是有專利的。 最近的開發者是Alexander Roshal。雖然其解碼器有專利,編譯好的解壓程序仍然存在於若干平台,例如開源的7-Zip。盡管業界普遍混亂,似乎沒有純開源模塊能解壓版本超過2.0的RAR文件 WinRAR 內置程序可以解開 CAB、ARJ、LZH、TAR、GZ、ACE、UUE、BZ2、JAR、ISO、Z 和 7Z 等多種類型的檔案文件、鏡像文件和 TAR 組合型文件;具有歷史記錄和收藏夾功能;新的壓縮和加密演算法,壓縮率進一步提高,而資源佔用相對較少,並可針對不同的需要保存不同的壓縮配置;固定壓縮和多卷自釋放壓縮以及針對文本類、多媒體類和 PE 類文件的優化演算法是大多數壓縮工具所不具備的;使用非常簡單方便,配置選項也不多,僅在資源管理器中就可以完成你想做的工作;對於 ZIP 和 RAR 的自釋放檔案文件,點擊屬性就可以輕易知道此文件的壓縮屬性,如果有注釋,還能在屬性中查看其內容;對於 RAR 格式(含自釋放)檔案文件提供了獨有的恢復記錄和恢復卷功能,使數據安全得到更充分的保障。 WinRAR 是共享軟體。任何人都可以在40天的測試期內使用它。如果你希望在測試過期之後繼續使用 WinRAR,你必須注冊。 它沒有其它附加的許可費用。除了與創建和發布 RAR壓縮文件或自解壓格式壓縮文件相關的注冊成本之外,沒有其它附加許可費用。合法的注冊用戶可以使用他們的 RAR副本製作發布壓縮文件而無須任何附加的 RAR 版稅。 如果你注冊了 WinRAR,可以免費升級所有的最新版本。 目前最新的 WinRAR 版本為 WinRAR 4.01 正式版。這個目前仍是要收費的。 運行環境:Windows 9x 及以上版本。
『拾』 壓縮是干什麼的
加以壓力,以減小體積、大小、持續時間、密度和濃度等
壓縮是一種通過特定的演算法來減小計算機文件大小的機制。這種機制是一種很方便的發明,尤其是對網路用戶,因為它可以減小文件的位元組總數,使文件能夠通過較慢的互聯網連接實現更快傳輸,此外還可以減少文件的磁碟佔用空間
壓縮(compression)是為了減少數據大小以節省保存空間和傳輸的時間。為了數據的傳輸,壓縮能夠作用於單獨的數據內容或者所有的傳輸單元(包括數據頭),這取決於一些特定的因素。
內容壓縮很簡單,它就是移除多餘的空白字元,插入單個的重復字元指出一個字元串中重復的字元,以及將小型的位串用頻繁使用的字元替代。這種類型的壓縮能夠將文本文件的大小減少50%。壓縮由使用特定公式和演算法的程序來執行,它確定如何壓縮和解壓數據。利用演算法將文件有損或無損地處理,以達到保留最多文件信息,而令文件體積變小。壓縮文件的基本原理是查找文件內的重復位元組,並建立一個相同位元組的"詞典"文件,並用一個代碼表示,比如在文件里有幾處有一個相同的詞"中華人民共和國"用一個代碼表示並寫入"詞典"文件,這樣就可以達到縮小文件的目的軟體。由於計算機處理的信息是以二進制數的形式表示的,因此壓縮軟體就是把二進制信息中相同的字元串以特殊字元標記來達到壓縮的目的。為了有助於理解文件壓縮,請您在腦海里想像一幅藍天白雲的圖片。對於成千上萬單調重復的藍色像點而言,與其一個一個定義「藍、藍、藍……」長長的一串顏色,還不如告訴電腦:「從這個位置開始存儲1117個藍色像點」來得簡潔,而且還能大大節約存儲空間。這是一個非常簡單的圖像壓縮的例子。其實,所有的計算機文件歸根結底都是以「1」和「0」的形式存儲的,和藍色像點一樣,只要通過合理的數學計算公式,文件的體積都能夠被大大壓縮以達到「數據無損稠密」的效果。總的來說,壓縮可以分為有損和無損壓縮兩種。如果丟失個別的數據不會造成太大的影響,這時忽略它們是個好主意,這就是有損壓縮。有損壓縮廣泛應用於動畫、聲音和圖像文件中,典型的代表就是影碟文件格式mpeg、音樂文件格式mp3和圖像文件格式jpg。但是更多情況下壓縮數據必須准確無誤,人們便設計出了無損壓縮格式,比如常見的zip、rar等。壓縮軟體(compression software)自然就是利用壓縮原理壓縮數據的工具,壓縮後所生成的文件稱為壓縮包(archive),體積只有原來的幾分之一甚至更小。當然,壓縮包已經是另一種文件格式了,如果你想使用其中的數據,首先得用壓縮軟體把數據還原,這個過程稱作解壓縮。常見的壓縮軟體有Winzip、WinRAR等。
有兩種形式的重復存在於計算機數據中,zip就是對這兩種重復進行了壓縮。
第一種
一種是短語形式的重復,即三個位元組以上的重復,對於這種重復,zip用兩個數字:1.重復位置距當前壓縮位置的距離;2.重復的長度,來表示這個重復,假設這兩個數字各佔一個位元組,於是數據便得到了壓縮,這很容易理解。
一個位元組有 0 - 255 共 256 種可能的取值,三個位元組有 256 * 256 * 256 共一千六百多萬種可能的情況,更長的短語取值的可能情況以指數方式增長,出現重復的概率似乎極低,實則不然,各種類型的數據都有出現重復的傾向,一篇論文中,為數不多的術語傾向於重復出現;一篇小說,人名和地名會重復出現;一張上下漸變的背景圖片,水平方向上的像素會重復出現;程序的源文件中,語法關鍵字會重復出現(我們寫程序時,多少次前後、paste?),以幾十 K 為單位的非壓縮格式的數據中,傾向於大量出現短語式的重復。經過上面提到的方式進行壓縮後,短語式重復的傾向被完全破壞,所以在壓縮的結果上進行第二次短語式壓縮一般是沒有效果的。
第二種
第二種重復為單位元組的重復,一個位元組只有256種可能的取值,所以這種重復是必然的。其中,某些位元組出現次數可能較多,另一些則較少,在統計上有分布不均勻的傾向,這是容易理解的,比如一個 ASCII 文本文件中,某些符號可能很少用到,而字母和數字則使用較多,各字母的使用頻率也是不一樣的,據說字母 e 的使用概率最高;許多圖片呈現深色調或淺色調,深色(或淺色)的像素使用較多(這里順便提一下:png圖片格式是一種無損壓縮,其核心演算法就是 zip 演算法,它和 zip 格式的文件的主要區別在於:作為一種圖片格式,它在文件頭處存放了圖片的大小、使用的顏色數等信息);上面提到的短語式壓縮的結果也有這種傾向:重復傾向於出現在離當前壓縮位置較近的地方,重復長度傾向於比較短(20位元組以內)。這樣,就有了壓縮的可能:給 256 種位元組取值重新編碼,使出現較多的位元組使用較短的編碼,出現較少的位元組使用較長的編碼,這樣一來,變短的位元組相對於變長的位元組更多,文件的總長度就會減少,並且,位元組使用比例越不均勻,壓縮比例就越大。
常用的壓縮軟體和壓縮格式
編輯
常用壓縮軟體
WinMount、WinRAR、WinZip、7-Zip 、coolrar
常見壓縮文件格式
主要有:rar,zip,tar,cab,uue,jar,iso,z,7-zip,ace,lzh,arj,gzip,bz2等壓縮文件。
經過壓縮軟體壓縮的文件叫壓縮文件,壓縮的原理是把文件的二進制代碼壓縮,把相鄰的0,1代碼減少,比如有000000,可以把它變成6個0 的寫法60,來減少該文件的空間。
JAR
JAR 文件就是 Java Archive File,顧名思意,它的應用是與 Java 息息相關的,是 Java 的一種文檔格式。JAR 文件非常類似 ZIP 文件——准確的說,它就是 ZIP 文件,所以叫它文件包。JAR 文件與 ZIP 文件唯一的區別就是在 JAR 文件的內容中,包含了一個 META-INF/MANIFEST.MF 文件,這個文件是在生成 JAR 文件的時候自動創建的。
ZIP
ZIP應該算是最常見的壓縮文件格式了,你甚至不需要單獨為它安裝一個壓縮或者解壓縮軟體,因為我們使用的Windows系統以及集成了對ZIP壓縮格式的支持。
RAR
雖然ZIP在壓縮文件格式中地位很高,但相當多的下載網站都選擇了用RAR格式來壓縮他們的文件,最根本的原因就在於RAR格式的文件壓縮率比ZIP更高。
7Z作為壓縮格式的後起新秀,7Z有著比RAR更高的壓縮率,能夠將文件壓縮的更加小巧。不過因為RAR格式已經高度普及,又沒有網路普及的「天時」相助,7Z想要取代RAR的地位還是相當不容易的。
CAB
CAB是微軟的一種安裝文件壓縮格式,主要應用於軟體的安裝程序中。因為涉及到安裝程序,所以cab文件中包含的文件通常都不是簡單的直接壓縮,而是對文件名等都進行了處理,所以雖然可以對其直接解壓縮,但解壓後得到的文件通常都無法直接使用。
ISO
很多朋友都認為ISO是一種壓縮格式,這源於WinRAR添加了對ISO格式「解壓」的支持。而實際上,ISO並不是壓縮格式,它之中所包含的文件也並沒有經過壓縮。ISO只是一種光碟的鏡像格式,完全復制並保存了光碟上的內容而已。所謂的對ISO「解壓」的過程,不過就是對ISO內文件的提取過程。
TAR
tar為後輟的文件能用WinZip或WinRAR打開,是因為WinZip或WinRar對.tar文件進行了關聯,也就是指可以用相應的解壓軟體將其解壓。
.tar是linux下較為常用的壓縮文件的格式,並不是什麼資料庫文件。
UUE
uue是一種在遇到郵件編碼混合引起亂碼的情況下比較有用的壓縮格式,可以用WinZip或者WinRAR打開。
上面我們主要只介紹了常用的壓縮文件。
壓縮基本原理
編輯
概述
如果您從互聯網上下載了許多程序和文件,可能會遇到很多ZIP文件。這種壓縮機制是一種很方便的發明,尤其是對網路用戶,因為它可以減小文件中的比特和位元組總數,使文件能夠通過較慢的互聯網連接實現更快傳輸,此外還可以減少文件的磁碟佔用空間。在下載了文件後,計算機可使用WinZip或Stuffit這樣的程序來展開文件,將其復原到原始大小。如果一切正常,展開的文件與壓縮前的原始文件將完全相同。 乍一聽好像很神秘:您是怎樣減少比特和位元組的數量並將它們原封不動地還原回去的呢?等一切水落石出之後,您會發現這個過程背後的基本理念其實非常簡單明了。在本文中,我們將討論這種通過簡單壓縮來明顯減小文件的方法。
大多數計算機文件類型都包含相當多的冗餘內容——它們會反復列出一些相同的信息。文件壓縮程序就是要消除這種冗餘現象。與反復列出某一塊信息不同,文件壓縮程序只列出該信息一次,然後當它在原始程序中出現時再重新引用它。
舉例
以我們熟悉的信息類型——單詞——為例子。
肯尼迪(John F. Kennedy)在1961年的就職演說中曾說過下面這段著名的話:
Ask not what your country can do for you——ask what you can do for your country.(不要問國家能為你做些什麼,而應該問自己能為國家做些什麼。)
這段話有17個單詞,包含61個字母、16個空格、1個破折號和1個句點。如果每個字母、空格或標點都佔用1個內存單元,那麼文件的總大小為79個單元。為了減小文件的大小,我們需要找出冗餘的部分。
我們立刻發現:
如果忽略大小寫字母間的區別,這個句子幾乎有一半是冗餘的。九個單詞(ask、not、what、your、country、can、do、for、you)幾乎提供了組成整句話所需的所有東西。為了構造出另一半句子,我們只需要拿出前半段句子中的單詞,然後加上空格和標點就行了。
大多數壓縮程序使用基於自適應字典的LZ演算法來縮小文件。「LZ」指的是此演算法的發明者Lempel和Ziv,「字典」指的是對數據塊進行歸類的方法。
排列字典的機制有很多種,它也可以像編號列表那樣簡單。在我們檢查肯尼迪這句著名講話時,可以挑出重復的單詞,並將它們放到編號索引中。然後,我們直接寫入編號而不是寫入整個單詞。
結論
因此,如果我們的字典是:
ask
what
your
country
can
do
for
you
我們的句子就應該是這樣的:
1 not 2 3 4 5 6 7 8-- 1 2 8 5 6 7 3 4
如果您了解這種機制,那麼只需使用該字典和編號模式即可輕松重新構造出原始句子。這就是在展開某個下載文件時,計算機中的解壓縮程序所做的工作。你可能還遇到過能夠自行解壓縮的壓縮文件。若要創建這種文件,編程人員需要在被壓縮的文件中設置一個簡單的解壓縮程序。在下載完畢後,它可以自動重新構造出原始文件。
但是使用這種機制究竟能夠節省多少空間呢?「1 not 2 3 4 5 6 7 8——1 2 8 5 6 7 3 4」當然短於「Ask not what your country can do for you-- ask what you can do for your country.」,但應注意的是,我們需要隨文件一起保存這個字典。
在實際壓縮方案中,計算出各種文件需求是一個相當復雜的過程。讓我們回過頭考慮一下上面的例子。每個字元和空格都佔用1個內存單元,整個原句要佔用79個單元。壓縮後的句子(包括空格)佔用了37個單元,而字典(單詞和編號)也佔用了37個單元。也就是說,文件的大小為74個單元,因此我們並沒有把文件大小減少很多。
但這只是一個句子的情況!可以想像的是,如果用該壓縮程序處理完肯尼迪講話的其餘部分,我們會發現這些單詞以及其他單詞重復了更多次。而且,正如下一節所言,為了得到盡可能高的組織效率,可以對字典進行重寫。
在上一個的例子中,我們挑出了所有重復的單詞並將它們放在一個字典中。對於我們來說,這是最顯而易見的字典編寫方法。但是壓縮程序卻不這樣認為:它對單詞沒有概念——它只會尋找各個模式。為了盡可能減小文件的大小,它會仔細挑選出最優模式。
如果從這個角度處理該句子,我們最終會得到一個完全不同的字典。
如果壓縮程序掃描肯尼迪的這句話,它遇到的第一個冗餘部分只有幾個字母長。在ask not what your中,出現了一個重復的模式,即字母t後面跟一個空格——在not和what中。如果壓縮程序將此模式寫入字典,則每次出現「t」後面跟一個空格的情況時,它會寫入一個「1」。但是在這個短句中,此模式的出現次數不夠多,不足以將其保留為字典中的一個條目,因此程序最終會覆蓋它。
程序接下來注意到的內容是ou,在your和country中都出現了它。如果這是一篇較長的文檔,將此模式寫入字典會節省大量空間——在英語中ou是一個十分常見的字母組合。但是在壓縮程序看完整個句子後,它立即發現了一個更好的字典條目選擇:不僅ou發生了重復,而且your和country整個單詞都發生了重復,並且它們實際上是作為一個短語your country一起發生重復的。在本例中,程序會用your country條目覆蓋掉字典中的ou條目。
短語can do for也發生了重復,一次後面跟著your,另一次跟著you,因此我們又發現can do for you也是一種重復模式。這樣,我們可以用一個數字來代替15個字元(包含空格),而your country只允許我們用一個數字代替13個字元(包含空格),所以程序會用r country條目覆蓋your country條目,然後再寫入一個單獨的can do for you條目。程序通過這種方式繼續工作,挑出所有重復的信息,然後計算應該將哪一種模式寫入字典。基於自適應字典的LZ演算法中的「自適應」部分指的就是這種重寫字典的能力。程序執行此工作的過程實際上非常復雜。
無論使用什麼方法,這種深入搜索機制都能比僅僅挑出單詞這種方法更有效率地對文件進行壓縮。如果使用我們上面提取出的模式,然後用「__」代替空格,最終將得到下面這個更大的字典:
ask__
what__
you
r__country
__can__do__for__you
而句子則較短:
「1not__2345__--__12354」
句子佔用18個內存單元,字典佔用41個單元。所以,我們將文件總大小從79個單元壓縮到了59個單元!這僅僅是壓縮句子的一種方法,而且不一定是最高效的方法。(看看您能找到更好的方法嗎!)
優勢
編輯
那麼這種機制到底有多好呢?文件壓縮率取決於多種因素,包括文件類型、文件大小和壓縮方案。
在世界上的大多數語言中,某些字母和單詞經常以相同的模式一起出現。正是由於這種高冗餘性,而導致文本文件的壓縮率會很高。通常大小合適的文本文件的壓縮率可以達到50%或更高。大多數編程語言的冗餘度也很高,因為它們的命令相對較少,並且命令經常採用一種設定的模式。對於包含大量不重復信息的文件(例如圖像或MP3文件),則不能使用這種機制來獲得很高的壓縮率,因為它們不包含重復多次的模式。
如果文件有大量重復模式,那麼壓縮率通常會隨著文件大小的增加而增加。從我們的例子中就可以看出這一點——如果我們摘錄的肯尼迪講話再長一些,您會發現又多次出現了我們字典中的模式,因此能夠通過每個字典條目節省更多的文件空間。此外,對於更大的文件,還可能出現具有更大普遍性的模式,從而能夠創建出效率更高的字典。
此外,文件壓縮效率還取決於壓縮程序使用的具體演算法。有些程序能夠在某些類型的文件中更好地尋找到模式,因此能更有效地壓縮這些類型的文件。其他一些壓縮程序在字典中又使用了字典,這使它們在壓縮大文件時表現很好,但是在壓縮較小的文件時效率不高。盡管這一類的所有壓縮程序都基於同一個基本理念,但是它們的執行方式卻各不相同。程序開發人員始終在嘗試建立更好的壓縮機制。
有損壓縮和無損壓縮
編輯
我們在上文中討論的壓縮類型稱為無損壓縮,因為您重新創建的文件與原始文件完全相同。所有無損壓縮都基於這樣一種理念:將文件變為「較小」的形式以利於傳輸或存儲,並在另一方收到它後復原以便重新使用它。
有損壓縮則與此大不相同。這些程序直接去除「不必要」的信息,對文件進行剪裁以使它變得更小。這種類型的壓縮大量應用於減小點陣圖圖像的文件大小,因為點陣圖圖像的體積通常非常龐大。為了了解有損壓縮的工作原理,讓我們看看你的計算機如何對一張掃描的照片進行壓縮。
對於此類文件,無損壓縮程序的壓縮率通常不高。盡管圖片的大部分看起來都是相同的——例如,整個天空都是藍色的——但是大部分像素之間都存在微小的差異。為了使圖片變得更小同時不降低其解析度,您必須更改某些像素的顏色值。如果圖片中包含大量的藍色天空,程序會挑選一種能夠用於所有像素的藍色。然後,程序重寫該文件,所有天空像素的值都使用此信息。如果壓縮方案選擇得當,您不會注意到任何變化,但是文件大小會顯著減小。
當然,對於有損壓縮,在文件壓縮後您無法將其復原成原始文件的樣子。您必須接受壓縮程序對原始文件的重新解釋。因此,如果需要完全重現原來的內容(例如軟體應用程序、資料庫和總統就職演說),則不應該使用這種壓縮形式。