❶ 根據解碼後數據與原始數據是否完全一致進行分類,數據壓縮方法一般劃分為
分為有損壓縮和無損壓縮。應該只有這兩種情況。有損壓縮不能100%還原數據源,比如聲音文件,圖像文件和影響文件。無損壓縮必須100%還原源數據。不然就是數據丟失
❷ zip 、rar、iso、7z 各自的區別、優點、不足是什麼
zip是目前最老的壓縮文件格式,至於優點,本人認為就是各個方面的動心都很平衡,不會出現太慢壓縮率太大的情況。
rar相對於zip是比較新的,而且壓縮率比zip高,但缺點是壓縮比較費時。
至於ISO,優點不好說,唯一的就是能起到光碟機的作用吧。但是它的作用還是很大的,現在裝系統用的文件和大型軟體如office都是用它壓縮安裝的。
7z是 最近幾年新興的一種格式優點就是壓縮率高,解壓快,壓縮快。缺點是對於部分東西壓縮或解壓的非常慢
至於區別,好像除了後綴不同之外,只有ISO能刻錄虛擬光碟機了
純手打,滿意請採納
❸ 壓縮文件的類型有那些
歸結一下,據我所知一般有以下幾種:
.rar (現在比較流行的壓縮格式,我們幾乎都用它)
.zip (老牌的壓縮格式)
.cab (windows安裝程序的專用壓縮格式,經常可以在安裝包下看到)
.iso (winiso的光碟鏡像格式,通常用於虛擬光碟機,可以用rar查看)
.jar (java程序的壓縮包格式)
.ace (winace的壓縮格式)
.7z (7-Zip壓縮格式,號稱有著現今最高壓縮比的,我沒有用過- -)
.tar (也是java程序的壓縮格式,通常linux生成的就是)
.gz (http上可以改善web程序性能,linux下用於文件壓縮,通常可以看見.tar.gz的後綴)
.arj (DOS下最好的壓縮工具)
.lzh (比較古老的壓縮格式)
.uue (unix中採用uuencode編碼格式生成的文件)
.bz2 (linux下的壓縮格式,同.gz,但壓縮比要高於.gz)
.z (linux下的壓縮格式,同.gz)
以上格式都可用WinRAR解開
❹ 壓縮文件為什麼有的容量比原文件小,它主要把什麼壓縮掉呢
因為有些文件格式相對較大。。比如BMP格式的圖片。壓縮比較基本上在100倍左右。。因此為了節省空間。。就需要對數據進行壓縮
1.什麼是數據壓縮
數據壓縮,通俗地說,就是用最少的數碼來表示信號。其作用是:能較快地傳輸各種信號,如傳真、Modem通信等;在現有的通信干線並行開通更多的多媒體業務,如各種增值業務;緊縮數據存儲容量,如CD-ROM、VCD和DVD等;降低發信機功率,這對於多媒體移動通信系統尤為重要。由此看來,通信時間、傳輸帶寬、存儲空間甚至發射能量,都可能成為數據壓縮的對象。
2.數據為何能被壓縮
首先,數據中間常存在一些多餘成分,既冗餘度。如在一份計算機文件中,某些符號會重復出現、某些符號比其他符號出現得更頻繁、某些字元總是在各數據塊中可預見的位置上出現等,這些冗餘部分便可在數據編碼中除去或減少。冗餘度壓縮是一個可逆過程,因此叫做無失真壓縮,或稱保持型編碼。
其次,數據中間尤其是相鄰的數據之間,常存在著相關性。如圖片中常常有色彩均勻的背影,電視信號的相鄰兩幀之間可能只有少量的變化影物是不同的,聲音信號有時具有一定的規律性和周期性等等。因此,有可能利用某些變換來盡可能地去掉這些相關性。但這種變換有時會帶來不可恢復的損失和誤差,因此叫做不可逆壓縮,或稱有失真編碼、摘壓縮等。
此外,人們在欣賞音像節目時,由於耳、目對信號的時間變化和幅度變化的感受能力都有一定的極限,如人眼對影視節目有視覺暫留效應,人眼或人耳對低於某一極限的幅度變化已無法感知等,故可將信號中這部分感覺不出的分量壓縮掉或「掩蔽掉」。這種壓縮方法同樣是一種不可逆壓縮。
對於數據壓縮技術而言,最基本的要求就是要盡量降低數字化的在碼事,同時仍保持一定的信號質量。不難想像,數據壓縮的方法應該是很多的,但本質上不外乎上述完全可逆的冗餘度壓縮和實際上不可逆的嫡壓縮兩類。冗餘度壓縮常用於磁碟文件、數據通信和氣象衛星雲圖等不允許在壓縮過程中有絲毫損失的場合中,但它的壓縮比通常只有幾倍,遠遠不能滿足數字視聽應用的要求。
在實際的數字視聽設備中,差不多都採用壓縮比更高但實際有損的媳壓縮技術。只要作為最終用戶的人覺察不出或能夠容忍這些失真,就允許對數字音像信號進一步壓縮以換取更高的編碼效率。摘壓縮主要有特徵抽取和量化兩種方法,指紋的模式識別是前者的典型例子,後者則是一種更通用的摘壓縮技術。
更加詳細的資料看這里吧。
http://www.kdntc.cn/nic/netstudy/wsjs/tongxin/shu/039.htm
-----------------------------
數據壓縮是通過減少計算機中所存儲數據或者通信傳播中數據的冗餘度,達到增大數據密度,最終使數據的存儲空間減少的技術。
數據壓縮在文件存儲和分布式系統領域有著十分廣泛的應用。數據壓縮也代表著尺寸媒介容量的增大和網路帶寬的擴展。
數據壓縮就是將字元串的一種表示方式轉換為另一種表示方式,新的表示方式包含相同的信息量,但是長度比原來的方式盡可能的短。
1. 數據壓縮與編碼
數據壓縮跟編碼技術聯系緊密,壓縮的實質就是根據數據的內在聯系將數據從一種編碼映射為另一種編碼。壓縮前的數據要被劃分為一個一個的基本單元。基本單元既可以是單個字元,也可以是多個字元組成的字元串。稱這些基本單元為源消息,所有的源消息構成源消息集。源消息集映射的結果為碼字集。可見,壓縮前的數據是源消息序列,壓縮後的數據是碼字序列。
若定義塊為固定長度的字元或字元串,可變長為長度可變的字元或字元串,則編碼可分為塊到塊編碼、塊到可變長編碼、可變長到塊編碼、可變長到可變長編碼等。應用最廣泛的ASCII編碼就是塊到塊編碼。
2. 數據壓縮的分類
數據壓縮按照映射是否固定可分為靜態數據壓縮和動態數據壓縮。靜態數據壓縮是指壓縮前源消息集到碼字集之間的映射是固定的,出現在被壓縮數據中的源消息每次都被映射為同一碼字。動態數據壓縮是指源消息集到碼字集的映射會隨著壓縮進度的變化而變化。靜態壓縮編碼需要兩步,先計算出源消息出現的頻率,確定源消息到碼字之間的映射;然後完成映射。動態數據壓縮則只需一步就能完成,它在壓縮過程中只對源消息集掃描一次。有些數據壓縮演算法是混合型的,綜合應用了靜態數據壓縮和動態數據壓縮技術。
3. 評價數據壓縮的標准
從實際應用來說,數據壓縮可從兩方面來衡量:數據壓縮速度和數據壓縮率。當數據壓縮應用於網路傳輸時,主要考慮速度快慢;當數據壓縮應用於數據存儲中,主要考慮壓縮率,即壓縮後數據的大小。當然這兩方面是相輔相成的。
常用的評價標准有冗餘度、平均源信息長度、壓縮率等。對於一種編碼方式是否為較好的編碼,主要看該編碼的冗餘度是否最小。
4. 常見的數據壓縮工具
現在操作簡單,使用方便,功能強大的數據壓縮工具有很多。最常見的是WinZip和WinRAR。
數據壓縮通過減少數據的冗餘度來減少數據在存儲介質上的存儲空間,而數據備份則通過增加數據的冗餘度來達到保護數據安全的目的。兩者在實際應用中常常結合起來使用。通常將要備份的數據進行壓縮處理,然後將壓縮後的數據用備份進行保護。當需要恢復數據時,先將備份數據恢復,再解壓縮。
由於計算機中的數據十分寶貴又比較脆弱,數據備份無論對國家、企業和個人來說都非常重要。數據備份能在較短的時間內用很小的代價,將有價值的數據存放到與初始創建的存儲位置相異的地方;當數據被破壞時,用較短的時間和較小的花費將數據全部恢復或部分恢復。
1. 對備份系統的要求
不同的應用環境有不同的備份需求,一般來說,備份系統應該有以下特性。
☆ 穩定性:備份系統本身要很穩定和可靠。
☆ 兼容性:備份系統要能支持各種操作系統、資料庫和典型應用軟體。
☆ 自動化:備份系統要有自動備份功能,並且要有日誌記錄。
☆ 高性能:備份的效率要高,速度要盡可能的快。
☆ 操作簡單:以適應不同層次的工作人員的要求,減輕工作人員負擔。
☆ 實時性:對於某些不能停機備份的數據,要可以實時備份,以確保數據正確。
☆ 容錯性:若有可能,最好有多個備份,確保數據安全可靠。
2. 數據備份的種類
數據備份按所備份數據的特點可分為完全備份、增量備份和系統備份。
完全備份是指對指定位置的所有數據都備份,它佔用較大的空間,備份過程的時間也較長。增量備份是指數據有變化時對變化的部分進行備份,它佔用空間小,時間短。完全備份一般在系統第一次使用時進行,而增量備份則經常進行。系統備份是指對整個系統進行備份。它一般定期進行,佔用空間較大,時間較長。
3. 數據備份的常用方法
數據備份根據使用的存儲介質種類可分為軟盤備份、磁帶備份、光碟備份、優盤備份、移動硬碟備份、本機多個硬碟備份和網路備份。用戶可以根據數據大小和存儲介質的大小是否匹配進行選擇。
數據備份是被動的保護數據的方法,用戶應根據不同的應用環境來選擇備份系統、備份設備和備份策略。
http://ke..com/view/286827.html
---------------------------
有損數據壓縮方法是經過壓縮、解壓的數據與原始數據不同但是非常接近的壓縮方法。有損數據壓縮又稱破壞型壓縮,即將次要的信息數據壓縮掉,犧牲一些質量來減少數據量,使壓縮比提高。這種方法經常用於網際網路尤其是流媒體以及電話領域。在這篇文章中經常成為編解碼。它是與無損數據壓縮對應的壓縮方法。根據各種格式設計的不同,有損數據壓縮都會有 generation loss:壓縮與解壓文件都會帶來漸進的質量下降。
[編輯] 有損壓縮的類型
有兩種基本的有損壓縮機制:
一種是有損變換編解碼,首先對圖像或者聲音進行采樣、切成小塊、變換到一個新的空間、量化,然後對量化值進行熵編碼。
另外一種是預測編解碼,先前的數據以及隨後解碼數據用來預測當前的聲音采樣或者或者圖像幀,預測數據與實際數據之間的誤差以及其它一些重現預測的信息進行量化與編碼。
有些系統中同時使用這兩種技術,變換編解碼用於壓縮預測步驟產生的誤差信號。
有損與無損壓縮比較
有損方法的一個優點就是在有些情況下能夠獲得比任何已知無損方法小得多的文件大小,同時又能滿足系統的需要。
有損方法經常用於壓縮聲音、圖像以及視頻。有損視頻編解碼幾乎總能達到比音頻或者靜態圖像好得多的壓縮率(壓縮率是壓縮文件與未壓縮文件的比值)。音頻能夠在沒有察覺的質量下降情況下實現 10:1 的壓縮比,視頻能夠在稍微觀察質量下降的情況下實現如 300:1 這樣非常大的壓縮比。有損靜態圖像壓縮經常如音頻那樣能夠得到原始大小的 1/10,但是質量下降更加明顯,尤其是在仔細觀察的時候。
當用戶得到有損壓縮文件的時候,譬如為了節省下載時間,解壓文件與原始文件在數據位的層面上看可能會大相徑庭,但是對於多數實用目的來說,人耳或者人眼並不能分辨出二者之間的區別。
一些方法將人體解剖方面的特質考慮進去,例如人眼只能看到一定頻率的光線。心理聲學模型描述的是聲音如何能夠在不降低聲音感知質量的前提下實現最大的壓縮。
人眼或人耳能夠察覺的有損壓縮帶來的缺陷稱為壓縮失真(en:compression artifact)。
http://ke..com/view/583477.html
❺ 多媒體數據壓縮技術的原理分類
根據編碼原理進行分類,大致有編碼、變換編碼、統計編碼、分析-合成編碼、混合編碼和其他一些編碼方法。其中統計編碼是無失真的編碼,其他編碼方法基本上都是有失真的編碼。
預測編碼是針對空間冗餘的壓縮方法,其基本思想是利用已被編碼的點的數據值,預測鄰近的一個像素點的數據值。預測根據某個模型進行。如果模型選取得足夠好的話,則只需存儲和傳輸起始像素和模型參數就可代表全部數據了。按照模型的不同,預測編碼又可分為線性預測、幀內預測和幀間預測。
變換編碼也是針對空間冗餘和時間冗餘的壓縮方法。其基本思想是將圖像的光強矩陣(時域信號)變換到系統空間(頻域)上,然後對系統進行編碼壓縮。在空間上具有強相關性的信號,反映在頻域上是某些特定區域內的能量常常被集中在一起,或者是系數矩陣的發布具有某些規律。可以利用這些規律,分配頻域上的量化比特數,從而達到壓縮的目的。由於時域映射到頻域總是通過某種變換進行的,因此稱變換編碼。因為正交變換的變換矩陣是可逆的,且逆矩陣與轉換置矩陣相等,解碼運算方便且保證有解,所以變換編碼總是採用正交變換。
統計編碼屬於無失真編碼。它是根據信息出現概率的分布而進行的壓縮編碼。編碼時某種比特或位元組模式的出現概率大,用較短的碼字表示;出現概率小,用較長的碼字表示。這樣,可以保證總的平均碼長最短。最常用的統計編碼方法是哈夫曼編碼方法。
分析-合成編碼實質上都是通過對原始數據的分析,將其分解成一系列更適合於表示「基元」或從中提取若干具有更為本質意義的參數,編碼僅對這些基本單元或特徵參數進行。解碼時則藉助於一定的規則或模型,按一定的演算法將這些基元或參數,「綜合」成原數據的一個逼近。這種編碼方法可能得到極高的數據壓縮比。
混合編碼綜合兩種以上的編碼方法,這些編碼方法必須針對不同的冗餘進行壓縮,使總的壓縮性能得到加強。
❻ 有損數據壓縮的類型
有兩種基本的有損壓縮機制:
一種是有損變換編解碼,首先對圖像或者聲音進行采樣、切成小塊、變換到一個新的空間、量化,然後對量化值進行熵編碼。
另外一種是預測編解碼,先前的數據以及隨後解碼數據用來預測當前的聲音采樣或者圖像幀,預測數據與實際數據之間的誤差以及其它一些重現預測的信息進行量化與編碼。
有些系統中同時使用這兩種技術,變換編解碼用於壓縮預測步驟產生的誤差信號。
❼ 數據壓縮的類型
數據壓縮可分成兩種類型,一種叫做無損壓縮,另一種叫做有損壓縮。
無損壓縮是指使用壓縮後的數據進行重構(或者叫做還原,解壓縮),重構後的數據與原來的數據完全相同;無損壓縮用於要求重構的信號與原始信號完全一致的場合。一個很常見的例子是磁碟文件的壓縮。無損壓縮演算法一般可以把普通文件的數據壓縮到原來的1/2~1/4。一些常用的無損壓縮演算法有霍夫曼(Huffman)演算法和LZW(Lenpel-Ziv & Welch)壓縮演算法。
有損壓縮是指使用壓縮後的數據進行重構,重構後的數據與原來的數據有所不同,但不影響人對原始資料表達的信息造成誤解。有損壓縮適用於重構信號不一定非要和原始信號完全相同的場合。例如,圖像和聲音的壓縮就可以採用有損壓縮,因為其中包含的數據往往多於我們的視覺系統和聽覺系統所能接收的信息,丟掉一些數據而不至於對聲音或者圖像所表達的意思產生誤解,但可大大提高壓縮比。
❽ 數據壓縮技術分為哪兩類使用方法是什麼
【導讀】數據壓縮技術是大數據傳輸過程中需要採用的一種數據存儲方法。那麼數據壓縮技術分為哪兩類?使用方法是什麼呢?為此小編今天就來和大家細細聊聊關於數據壓縮技術那些事,同時也提醒各位大數據工程師在使用數據壓縮過程中的一些注意事項及使用方法。
在數據壓縮中,通過使用比原始數據更少的位來對數據進行編碼,數據壓縮有兩種方法:無損壓縮,它消除了冗餘但不丟失任何原始數據;有損數據壓縮,可通過刪除不必要或不太重要的信息來修改數據,在大數據的傳輸和存儲中使用數據壓縮非常重要,因為它減少了IT部門必須為該數據提供的網路帶寬和存儲量,同樣重要的是,您實際上並不想保留某些類型的大數據,例如作為物聯網(IoT)通信數據一部分的設備間握手引起的抖動。
為了最大程度地利用大數據進行數據壓縮,您必須知道何時何地使用不同類型的數據壓縮工具和公式。選擇數據壓縮方法時,請牢記以下幾條有用的准則:
何時使用無損數據壓縮
如果您有一個大數據應用程序,並且無法承受丟失任何數據的麻煩,並且需要解壓縮壓縮的每個位元組的數據,那麼您將需要一種無損的數據壓縮方法,當您壓縮來自資料庫的數據時,即使您意味著必須存儲更多的數據,也希望進行無損數據壓縮。在選擇將此數據重新提交到其資料庫時,您需要解壓縮完整數據,以便它可以與資料庫端的數據匹配並進行存儲。
何時使用有損數據壓縮
有時您不需要或不需要所有數據,例如物聯網和網路設備的抖動,您不需要這些數據,只需提供給您業務所需的上下文信息的數據即可。第二個示例是在數據壓縮過程的前端可能使用的數據壓縮公式中使用人工智慧(AI),如果您正在研究一個特定的問題,並且只希望與該問題直接相關的數據,則可以決定讓數據壓縮公式不包含與該問題無關的任何數據。
如何選擇正確的編解碼器
一個編解碼器是一個硬體,軟體的組合,壓縮和解壓縮數據,所以它在大數據壓縮和解壓縮操作的核心作用,編解碼器有許多種,因此為正確的數據或文件類型選擇正確的編解碼器很重要,您選擇的編解碼器類型將取決於您嘗試壓縮的數據和文件類型,有無損和有損數據的編解碼器,也有一些編解碼器必須將所有數據文件作為「整體」處理,而其他編解碼器可以將數據分割開,以便可以對其進行並行處理,然後在其目的地重新組合,某些編解碼器設置用於可視數據,而其他編解碼器僅處理音頻數據。
為什麼數據壓縮很重要?
確定將用於大數據的數據壓縮類型是大數據操作的重要組成部分,僅在資源端,IT人員就無法承受處理失控和迅速發展的存儲的成本,即使必須完整存儲數據,也應盡可能地對其進行壓縮,也就是說,您可以採取其他步驟來限制存儲和處理,以及針對大數據壓縮中採用的演算法和方法的最適合操作,掌握這些選項是IT部門的關鍵數據點。
以上就是小編今天給大家整理分享關於「數據壓縮技術分為哪兩類?使用方法是什麼?」的相關內容希望對大家有所幫助。小編認為要想在大數據行業有所建樹,需要考取部分含金量高的數據分析師證書,這樣更有核心競爭力與競爭資本。
❾ 多媒體數據壓縮技術的失真分類
根據解碼後數據與原始數據是否完全一致進行分類,壓縮方法可被分為有失真編碼和無失真編碼兩大類。
有失真壓縮法會壓縮了熵,會減少信息量,而損失的信息是不能再恢復的,因此這種壓縮法是不可逆的。無失真壓縮法去掉或減少數據中的冗餘,但這些冗餘值是可以重新插入到數據中的,因此冗餘壓縮是可逆的過程。
無失真壓縮是不會產生失真。從信息主義角度講,無失真編碼是泛指那種不考慮被壓縮信息性質和壓縮技術。它是基於平均信息量的技術,並把所有的數據當作比特序列,而不是根據壓縮信息的類型來優化壓縮。也就是說,平均信息量編碼忽略被壓縮信息主義內容。在多媒體技術中一般用於文本、數據的壓縮,它能保證百分之百地恢復原始數據。但這種方法壓縮比較低,如LZW編碼、行程編碼、霍夫曼(Huffman)編碼的壓縮比一般在2:1至5:1之間。