① 壓縮編碼
在介紹圖象的壓縮編碼之前,先考慮一個問題:為什麼要壓縮?其實這個問題不用我回答,你也能想得到。因為圖象信息的數據量實在是太驚人了。舉一個例子就明白:一張A4(210mm×297mm) 幅面的照片,若用中等解析度(300dpi)的掃描儀按真彩色掃描,其數據量為多少?讓我們來計算一下:共有(300×210/25.4) ×(300×297/25.4)個象素,每個象素佔3個位元組,其數據量為26M位元組,其數據量之大可見一斑了。
如今在Internet上,傳統基於字元界面的應用逐漸被能夠瀏覽圖象信息的WWW(World Wide Web)方式所取代。WWW盡管漂亮,但是也帶來了一個問題:圖象信息的數據量太大了,本來就已經非常緊張的網路帶寬變得更加不堪重負,使得World Wide Web變成了World Wide Wait。
總之,大數據量的圖象信息會給存儲器的存儲容量,通信干線信道的帶寬,以及計算機的處理速度增加極大的壓力。單純靠增加存儲器容量,提高信道帶寬以及計算機的處理速度等方法來解決這個問題是不現實的,這時就要考慮壓縮。
壓縮的理論基礎是資訊理論。從資訊理論的角度來看,壓縮就是去掉信息中的冗餘,即保留不確定的信息,去掉確定的信息(可推知的),也就是用一種更接近信息本質的描述來代替原有冗餘的描述。這個本質的東西就是信息量(即不確定因素)。
壓縮可分為兩大類:第一類壓縮過程是可逆的,也就是說,從壓縮後的圖象能夠完全恢復出原來的圖象,信息沒有任何丟失,稱為無損壓縮;第二類壓縮過程是不可逆的,無法完全恢復出原圖象,信息有一定的丟失,稱為有損壓縮。選擇哪一類壓縮,要折衷考慮,盡管我們希望能夠無損壓縮,但是通常有損壓縮的壓縮比(即原圖象占的位元組數與壓縮後圖象占的位元組數之比,壓縮比越大,說明壓縮效率越高)比無損壓縮的高。
圖象壓縮一般通過改變圖象的表示方式來達到,因此壓縮和編碼是分不開的。圖象壓縮的主要應用是圖象信息的傳輸和存儲,可廣泛地應用於廣播電視、電視會議、計算機通訊、傳真、多媒體系統、醫學圖象、衛星圖象等領域。
壓縮編碼的方法有很多,主要分成以下四大類:(1)象素編碼;(2)預測編碼;(3)變換編碼;(4)其它方法。
所謂象素編碼是指,編碼時對每個象素單獨處理,不考慮象素之間的相關性。在象素編碼中常用的幾種方法有:(1)脈沖編碼調制(Pulse Code Molation,簡稱PCM);(2)熵編碼(Entropy Coding);(3)行程編碼(Run Length Coding);(4)位平面編碼(Bit Plane Coding)。其中我們要介紹的是熵編碼中的哈夫曼(Huffman)編碼和行程編碼(以讀取.PCX文件為例)。
所謂預測編碼是指,去除相鄰象素之間的相關性和冗餘性,只對新的信息進行編碼。舉個簡單的例子,因為象素的灰度是連續的,所以在一片區域中,相鄰象素之間灰度值的差別可能很小。如果我們只記錄第一個象素的灰度,其它象素的灰度都用它與前一個象素灰度之差來表示,就能起到壓縮的目的。如248,2,1,0,1,3,實際上這6個象素的灰度是248,250,251,251,252,255。表示250需要8個比特,而表示2隻需要兩個比特,這樣就實現了壓縮。
常用的預測編碼有Δ調制(Delta Molation,簡稱DM);微分預測編碼(Differential Pulse Code Molation,DPCM),具體的細節在此就不詳述了。
所謂變換編碼是指,將給定的圖象變換到另一個數據域(如頻域)上,使得大量的信息能用較少的數據來表示,從而達到壓縮的目的。變換編碼有很多,如(1)離散傅立葉變換(Discrete Fourier Transform,簡稱DFT);(2)離散餘弦變換(Discrete Cosine Transform,簡稱DCT);(3)離散哈達瑪變換(Discrete Hadamard Transform,簡稱DHT)。
其它的編碼方法也有很多,如混合編碼(Hybird Coding)、矢量量化(Vector Quantize,VQ) 、LZW演算法。在這里,我們只介紹LZW演算法的大體思想。
值得注意的是,近些年來出現了很多新的壓縮編碼方法,如使用人工神經元網路(Artificial Neural Network,簡稱ANN)的壓縮編碼演算法、分形(Fractl)、小波(Wavelet) 、基於對象(Object Based)的壓縮編碼演算法、基於模型(Model –Based)的壓縮編碼演算法(應用在MPEG4及未來的視頻壓縮編碼標准中)。
② 什麼是:圖像處理
幾十年前,美國在太空探索中拍回了大量月球照片,但是由於環境所限,照片非常不清楚。在運用圖像處理手段後,這些照片中的重要信息得以清晰再現,引起了巨大轟動。這也促進了圖像處理/信號處理技術的蓬勃發展。數字圖像處理在今天是非常熱門的技術之一。它也許就是可以改變人們生活方式的技術。 但在網路上,不少人對圖像處理還有些誤解,一提起圖像處理,大家就想起PhotoShop,就象一說多煤體,就想到Authorware,Director一樣。PhotoShop是非常優秀的軟體,乃至於它幾乎成為事實上的工業標准。然而,它所具有的功能,也只能是圖像處理中的一部份而已。圖像處理有許多分支,先拋開序列圖像和立體圖像不說,圖像處理比較重要的部份有:圖像編碼/圖像壓縮,圖像增強,圖像復原,圖像識別/圖像理解等。 搞這一行,主要的基礎是數學,基本上是一天到晚和演算法打交道。但是這一門學問涉及到的知識很廣也很雜,比如 圖像編碼的編碼理論基礎是資訊理論,抽象數學。圖像識別需要隨機過程,信號處理的知識。不少課題還需要更加專門的知識,如小波變換,神經網路,分形。當然,高等數學和矩陣理論/線性代數是絕對的基礎。然而圖像處理需要的這些知識並不要求有很大的深度,就是全然不懂這些東西,也可以做出很好的程序來。因為從工程角度來看不一定要很嚴密的數學論證。此外,這是一門應用性很強的學問,就有它的一些特點,要適應計算機的發展。比如說,付立葉變換是圖像處理常用的方法,到目前為止,庫利-圖基快速付立葉變換一直是主要演算法,它使運算需要的乘法數目大為降低,加法數目雖然增加很多,但對於大部份CPU來說,總的運算速度提升非常大。但是, Intel的CPU現在加入了MMX指令,具有並行,信號處理功能,用MMX指令,乘法和加法用時是一樣的,所以在MMX指令面前,快速演算法反而更慢,同時也就產生了新的適應MMX的快速演算法。再有,圖像處理的另一個特點,也是他的難點,就是採用方法的優劣和被處理對象的內容高度相關。也就是說,很難找到適用於各種情況的通用方法。因此,圖像處理按照處理的對象類別還可以分出遙感圖像處理,醫學圖像處理等等。 有許多學科和圖像處理有關系,如: 計算機圖形學:圖形(Graph)和圖像(Image)本身關系就比較密切,這兩者的區別也很顯著,一個是用點,線,面描述東西,多用幾何手段。另一個基本上只和像素點打交道。圖形領域比較有名的語言應該首推OpenGL,有名的軟體就更多了,各種CAD軟體好多。 模式識別:圖像處理的最重要目的之一就是識別,這也是圖像技術非常重要的原因。我們常常遇到一些如指紋鑒別,人臉識別 等需求,自然要和模式識別打交道。 人工智慧:可以說,圖像處理,模式識別,人工智慧是三位一體的學科。目前,圖像識別技術遇到很大困難,就是自動化程度做不高,也可以說是智能程度不夠。例如,人眼可以很容易從人群中找到自己要尋找的目標。但對於計算機來說,就連判斷一幅圖像中是否有人存在這樣看似簡單的問題都很難解決。人工智慧在近二十年裡發展得很緩慢,日本的智能計算機計劃以失敗告終。也沒有多少人承認深藍計算機國際象棋的勝利是人工智慧的結果。神經網路一度燃起了許多希望,但目前還尚需努力。 計算機視覺:這可能是圖像處理的較高境界了,從圖像中獲取信息,並對信息進行加工抽象,這門學問比較難。
③ 多媒體數據可以被壓縮的主要原因是數據之間存在冗餘和相關性
多媒體數據可以被壓縮的主要原因是數據之間存在冗餘和相關性。
數據壓縮的原理:
事實上,多媒體信息存在許多數據冗餘。
例如:
(1)一幅圖像中的靜止建築背景、藍天和綠地,其中許多像素是相同的如果逐點存儲,就會浪費許多空間,這稱為空間冗餘。
(2)在電視和動畫的相鄰序列中,只有運動物體有少許變化,僅存儲差異部分即可,這稱為時間冗餘。此外還有結構冗餘、視覺冗餘等,這就為數據壓縮提供了條件。
總之,壓縮的理論基礎是資訊理論。從信息的角度來看,壓縮就是去除掉信息中的冗餘,即去除掉確定的或可推知的信息,而保留不確定的信息,也就是用一種更接近信息本質的描述來代替原有的冗餘的描述,這個本質的東西就是信息量。
(3)圖像壓縮編碼的理論基礎是資訊理論擴展閱讀
數據壓縮的應用:
(1)一種非常簡單的壓縮方法是行程長度編碼,這種方法使用數據及數據長度這樣簡單的編碼代替同樣的連續數據,這是無損數據壓縮的一個實例。
這種方法經常用於辦公計算機以更好地利用磁碟空間、或者更好地利用計算機網路中的帶寬。對於電子表格、文本、可執行文件等這樣的符號數據來說,無損是一個非常關鍵的要求,因為除了一些有限的情況,大多數情況下即使是一個數據位的變化都是無法接受的。
(2)對於視頻和音頻數據,只要不損失數據的重要部分一定程度的質量下降是可以接受的。通過利用人類感知系統的局限,能夠大幅度得節約存儲空間並且得到的結果質量與原始數據質量相比並沒有明顯的差別。
這些有損數據壓縮方法通常需要在壓縮速度、壓縮數據大小以及質量損失這三者之間進行折衷。
(3)有損圖像壓縮用於數碼相機中,大幅度地提高了存儲能力,同時圖像質量幾乎沒有降低。用於DVD的有損MPEG-2編解碼視頻壓縮也實現了類似的功能。
在有損音頻壓縮中,心理聲學的方法用來去除信號中聽不見或者很難聽見的成分。人類語音的壓縮經常使用更加專業的技術,因此人們有時也將「語音壓縮」或者「語音編碼」作為一個獨立的研究領域與「音頻壓縮」區分開來。
不同的音頻和語音壓縮標准都屬於音頻編解碼范疇。例如語音壓縮用於網際網路電話,而音頻壓縮被用於CD翻錄並且使用 MP3 播放器解碼。
參考資料來源
網路-數據壓縮
④ 建設數字圖書館的主要技術是什麼
從計算機領域的研究角度出發,數字圖書館的研究和開發的若干關鍵技術如下。
1.數字圖書館系統結構模型:
數字圖書館是一個相當復雜的系統,必須有統一、規范和系統化的模型作為研究和開發數字圖書館的理論指導和前提。對數字圖書館模型的研究,根據建模側重點不同,可以將系統模型分為:結構模型、框架模型、動態模型、過程模型和功能模型。這五種模型各有所長,如何將其有機地結合和統一,形成對數字圖書館的相對完整刻畫,還需要做許多的研究工作。
2.數字圖書館資源管理:
數字圖書館研究和建設的迅速發展,系統資源和信息資源已經顯得非常重要,如何更加有效、合理地管理和利用有限的系統資源(cpu線程、i/o進程、緩沖區和網路處理)和信息資源滿足數字圖書館的各種需求,是資源管理研究的主要內容。其中包括資源管理的機制和策略、管理模型和優化演算法等。目前針對這個問題已經提出的解決方法:服務質量概念以及利用qos機制來解決該問題的方法;基於元調度方法「裝箱」方案;基於數字圖書館的三層模型和多媒體協商、cpu調度、緩沖區分配和差錯控制等方法。
3.分布式多媒體同步:
在數字圖書館的通信中有時不僅要求實時、等時地傳輸多媒體數據,而且要求各種媒體對象間保持時間和空間的同步約束。實時性、等時性和同步性是多媒體通信的基本特點,也是實現多媒體通信的關鍵技術和基礎。同步性要求各種媒體在傳輸後仍然保持原來時間和空間上的制約關系。目前國際上關於多媒體同步模型的研究可分為時間線模型、層次模型和參考點模型三類。各種媒體信息時態關系的研究也是多媒體同步中重要組成部分。目前多媒體同步模型的研究比較深入,人們提出了不少模型,但還沒有一種比較完善的、能夠滿足數字圖書館通信要求的分布式多媒體同步模型。
4.多媒體資料庫:
多媒體資料庫技術是以有效管理大量多媒體數據和相關信息為目標的資料庫系統,它是開發數字圖書館的關鍵技術之一,是多媒體、圖像處理和識別、人工智慧和資料庫技術相結合的產物。數字圖書館的媒體資源內容的組織方式將與傳統的方式不同。其內容將按照用戶需求挑選的高價值知識內容,經過分類、編輯、整理、加工,變成受教育者易於接受的形式。它是一種有很大增值的有序的知識庫,會出現新的知識產權關系。數字圖書館將資源分為元數據和對象數據。對象數據是指數字化的文本、圖像、聲音、影像等,元數據則是那些描述和管理對象數據的數據。對象數據呈分布式存放在各地的資源點內,元數據則有必要集中在數字圖書館中心的超大規模伺服器上,用戶查詢時,中心調度系統通過元數據調度各對象資料庫數據以提供服務。
5.基於內容的信息檢索:
基於內容的檢索技術是多媒體資料庫的重要組成部分,是目前數字圖書館研究的熱點關鍵技術之一。所謂基於內容的檢索是指根據媒體對象的語義和上下文聯系進行檢索。其特點在於:從媒體內容中提取信息特徵。即對圖像、視頻、音頻進行分析和特徵提取,利用這些內容建立特徵矢量作為索引進行檢索;是一種基於媒體多維特徵進行的近似性匹配,是一種信息檢索技術。該技術將支持從數字圖書館的多媒體資料庫中以用戶可以接受的響應速度查詢到所要求的信息。
6.數據壓縮:
該技術是信息科學的關鍵技術及基礎理論問題,同時也是建設數字圖書館系統的關鍵技術。壓縮編碼的理論基礎是資訊理論。從資訊理論的角度看, 壓縮就是去掉信息中的冗餘,即保留不確定的信息,去除確定的信息(可推知的),也就是用一種更接近信息本質的描述來代替原有冗餘的描述。編碼方法可以分成三類:(1)考慮圖像信源的統計特性。採用預測編碼方法、變換編碼方法、矢量量化編碼方法、子帶-小波編碼法、神經網路編碼法等。(2)考慮人眼視覺特性。採用基於方向濾波的圖像編碼法、基於圖像輪廓-紋理的編碼法。(3)考慮圖像傳遞的景物特徵採用分形編碼方法、基於模型的編碼方法。
7.網路:
在數字圖書館系統中,多媒體信息的存取、查詢、檢索和表現要求具有服務質量(qos)保證的通信網路。qos包括網路的吞吐量、帶寬、允許的延遲、抖動和差錯率等參數。設計一種綜合的協議體系結構和高效、大容量、寬頻帶網路並從工程上實現滿足qos要求的通信網路是建立數字圖書館系統的基礎和關鍵。
⑤ 圖像數據壓縮的主要依據有哪些
雖然表示圖像需要大量的數據,但圖像數據是高度相關的,或者說存在冗餘(Rendancy)信息,去掉這些冗餘信息後可以有效壓縮圖像,同時又不會損害圖像的有效信息。
數字圖像的冗餘表現為以下幾種形式:空間冗餘、時間冗餘、視覺冗餘、信息熵冗餘、結構冗餘和知識冗餘。
(1)空間冗餘:圖像內部相鄰像素之間存在較強的相關性所造成的冗餘。
(2)時間冗餘:視頻圖像序列中的不同幀之間的相關性所造成的冗餘。
(3)視覺冗餘:是指人眼不能感知或不敏感的那部分圖像信息。
(4)信息熵冗餘:也稱編碼冗餘,如果圖像中平均每個像素使用的比特數大於該圖像的信息熵,則圖像中存在冗餘,這種冗餘稱為信息熵冗餘。
(5)結構冗餘:是指圖像中存在很強的紋理結構或自相似性。
(6)知識冗餘:是指有些圖像還包含與某些先驗知識有關的信息。
圖像數據的這些冗餘信息為圖像壓縮編碼提供了依據。
例如,利用人眼對藍光不敏感的視覺特性,在對彩色圖像編碼時,就可以用較低的精度對藍色分量進行編碼。圖像編碼的目的就是充分利用圖像中存在的各種冗餘信息,特別是空間冗餘、時間冗餘以及視覺冗餘,以盡量少的比特數來表示圖像。利用各種冗餘信息,壓縮編碼技術能夠很好地解決在將模擬信號轉換為數字信號後所產生的帶寬需求增加的問題,它是使數字信號走上實用化的關鍵技術之一。
⑥ 計算機中的音頻和視頻的編碼方式
音頻信號的編碼方式大致分為三大類:
(1) 波形編碼,如PCM、APC、SDC、ATC
(2) 分析合成方法,如LPC
(3) 混合編碼方法
常用的編碼方式是PCM——脈沖調制。脈沖編碼調制(PCM)是把模擬信號變換為數字信號的一種調制方式,即把連續輸入的模擬信號變換為在時域和振幅上都離散的量,然後將其轉化為代碼形式傳輸或存儲。
音頻信號壓縮編碼的主要依據是人耳的聽覺特性,主要有兩點:
1.人的聽覺系統中存在一個聽覺閾值電平,低於這個電平的聲音信號人耳聽不到 .
2.人的聽覺存在屏蔽效應。當幾個強弱不同的聲音同時存在時,強聲使弱聲難以聽到,並且兩者之間的關系與其相對頻率的大小有關 .
3.對聲音波形采樣後,相鄰樣值之間存在著很強的相關性。
聲音編碼演算法就是通過這些特性來去掉更多的冗餘數據,來達到壓縮數據的目的。
視頻信號的壓縮與編碼
采樣、量化後的信號轉換成數字元號才能進行傳輸,這一過程稱為編碼。
視頻壓縮編碼的理論基礎是資訊理論。信息壓縮就是從時間域、空間域兩方面去除冗餘信息,將可推知的確定信息去掉。
視頻編碼技術主要包括MPEG與H.261標准,編碼技術主要分成幀內編碼和幀間編碼。前者用於去掉圖像的空間冗餘信息,後者用於去除圖像的時間冗餘信息。
呃,還好以前的課件還留著,稍稍拷了點過來。。
⑦ 實現視頻圖像數據壓縮的主要理論依據是什麼
實現視頻圖像數據壓縮的主要理論依據是香農提出的資訊理論。
隨著計算機技術和網路通信技術的飛速發展,實時可視化通信、多媒體通信、網路電視、視頻監控等業務越來越受到大家的關注。這樣,圖像壓縮技術就成為急需解決的問題。
數字圖像需要大量數據來表示,因此必須對其進行數據壓縮,但在壓縮的過程中,也會對傳輸介質、傳輸方法和存儲介質等提出較高要求。常用的圖像數據壓縮方法主要有哈夫曼編碼、行程編碼、算術編碼、離散餘弦變換編碼以及混合編碼等。
圖像壓縮是圖像存儲、處理和傳輸的基礎,它是用盡可能少的數據來進行圖像的存儲和傳輸。圖像數據是可以被壓縮的,支持這一理論的依據,允許圖像編碼有一定的失真;圖像數據的冗餘性。
大多數情況下,並不要求經壓縮後的圖像和原圖完全相同,而允許有少量失真,只要這些失真不被人眼察覺就可以接受。這給壓縮比的提高提供了有利的條件,可允許的失真愈多,可實現的壓縮效率就愈高。
因為圖像數據具有可壓縮性,有大量的所謂統計性質的多餘度,從而產生生理視覺上的多餘度,去掉這部分圖像數據並不影響視覺上的圖像質量,甚至去掉一些圖像細節對於實際圖像的質量也無致命的影響。
⑧ 衡量數據壓縮方法的指標有哪些
衡量數據壓縮方法的指標:壓縮比、速度、效果。
數據壓縮是指在不丟失信息的前提下,縮減數據量以減少存儲空間,提高其傳輸、存儲和處理效率的一種技術方法。或按照一定的演算法對數據進行重新組織,減少數據的冗餘和存儲的空間。數據壓縮包括有損壓縮和無損壓縮。
數據壓縮分為兩類,有三種分法:
1、即時壓縮和非即時壓縮
即時壓縮是將語音信號轉化為數字信號,同時進行壓縮,然後即時通過Internet傳送出去。即時壓縮一般應用在影像、聲音數據的傳送中。
非即時壓縮是在需要的情況下才進行,沒有即時性。非即時壓縮一般不需要專門的設備,直接在計算機中安裝並使用相應的壓縮軟體即可。
2、數字壓縮和文件壓縮
數字壓縮是專指一些具有時間性的數據,這些數據常常是即時採集、即時處理或傳輸的。
文件壓縮是專指對將要保存在磁碟等物理介質的數據進行壓縮,如一篇文章數據、一段音樂數據、一段程序編碼數據等的壓縮。
3、無損壓縮與有損壓縮
無損壓縮利用數據的統計冗餘進行壓縮,所以無損壓縮的壓縮比一般比較低。這類方法廣泛應用於文本數據、程序和特殊應用場合的圖像數據等需要精確存儲數據的壓縮。
有損壓縮方法利用了人類視覺、聽覺對圖像、聲音中的某些頻率成分不敏感的特性,允許壓縮的過程中損失一定的信息。有損壓縮廣泛應用於語音、圖像和視頻數據的壓縮。
拓展資料:數據壓縮的應用:
一種非常簡單的壓縮方法是行程長度編碼,這種方法使用數據及數據長度這樣簡單的編碼代替同樣的連續數據,這是無損數據壓縮的一個實例。這種方法經常用於辦公計算機以更好地利用磁碟空間、或者更好地利用計算機網路中的帶寬。對於電子表格、文本、可執行文件等這樣的符號數據來說,無損是一個非常關鍵的要求,因為除了一些有限的情況,大多數情況下即使是一個數據位的變化都是無法接受的。
對於視頻和音頻數據,只要不損失數據的重要部分一定程度的質量下降是可以接受的。通過利用人類感知系統的局限,能夠大幅度地節約存儲空間並且得到的結果質量與原始數據質量相比並沒有明顯的差別。這些有損數據壓縮方法通常需要在壓縮速度、壓縮數據大小以及質量損失這三者之間進行折中。
有損圖像壓縮用於數碼相機中,大幅度地提高了存儲能力,同時圖像質量幾乎沒有降低。用於DVD的有損MPEG-2編解碼視頻壓縮也實現了類似的功能。
在有損音頻壓縮中,心理聲學的方法用來去除信號中聽不見或者很難聽見的成分。人類語音的壓縮經常使用更加專業的技術,因此人們有時也將「語音壓縮」或者「語音編碼」作為一個獨立的研究領域與「音頻壓縮」區分開來。不同的音頻和語音壓縮標准都屬於音頻編解碼范疇。例如語音壓縮用於網際網路電話,而音頻壓縮被用於CD翻錄並且使用MP3播放器解碼。
理論壓縮的理論基礎是資訊理論(它與演算法資訊理論密切相關)以及率失真理論,這個領域的研究工作主要是由Claude Shannon奠定的,他在二十世紀四十年代末期及五十年代早期發表了這方面的基礎性的論文。Doyle和Carlson在2000年寫道數據壓縮「有所有的工程領域最簡單、最優美的設計理論之一」。密碼學與編碼理論也是密切相關的學科,數據壓縮的思想與統計推斷也有很深的淵源。
許多無損數據壓縮系統都可以看作是四步模型,有損數據壓縮系統通常包含更多的步驟,例如它包括預測、頻率變換以及量化。
⑨ 什麼是計算機視頻處理技術
視頻處理技術
和一般的業務不同,視頻是流特性業務,數據量很大。例如,數字電視圖像中的SIF格式、NTSC制式、彩色、4∶4∶4采樣,每幀的數據量為2028Kb,每秒的數據流量可達60.8Mb;CCIR格式、PAL制式、4∶4∶4采樣的彩色視頻的數據流量可達148.8Mbps。實驗表明,176×144的YUV原始視頻在10Mbps的LAN上傳送速率是3幀/秒左右。可見,未壓縮的視頻在Internet上傳輸的效果是無法容忍的,而且會很容易地將Internet資源吞沒,造成網路擁塞甚至崩潰。因此,IP視頻通信的第一步就是視頻壓縮。
視頻壓縮編碼的理論基礎是資訊理論。壓縮就是從時域、空域兩方面去除冗餘信息,即將可推知的確定信息去掉。編碼方法大致可分為三類:
1.考慮到圖像信源的統計特性採用的預測編碼方法、變換編碼方法、矢量量化編碼方法、子帶-小波編碼方法及神經網路編碼方法等;
2.考慮到視覺特性採用的基於方向濾波的圖像編碼方法、基於圖像輪廓/紋理的編碼方法;
3.考慮到圖像傳遞的景物特徵,採用的分形編碼、基於模塊的編碼方法。
在IP視頻通信應用中,編碼方法的選擇不但要考慮到壓縮比、信噪比,還要考慮到演算法的復雜性。太復雜的編碼演算法可能會產生較高的壓縮比,但也會帶來較大的計算開銷,軟體實現時會影響通信的實時性。目前,在眾多視頻編碼演算法中,影響最大並被廣泛應用的演算法是MPEG和H.26x。
※MPEG編碼
MPEG是國際標准化組織ISO/IEC下的一個制定動態視頻壓縮編碼標準的組織,它為視頻壓縮編碼技術的標准化、實用化做出了巨大貢獻。如針對CD-ROM的1.5Mbps傳輸率的MPEG-1、針對HDTV的6Mbps以上傳輸速率的MPEG-2都已成功地得到應用,並創造了巨大的商業價值。MPEG-4是針對視頻會議、可視電話的甚低速率編碼標准,它融入了基於內容的檢索與編碼,可對壓縮數據內容直接訪問;即將於2001年制定完畢的MPEG-7標准被稱為"多媒體內容描述介面",這種標准化的描述可以加到任何類型的媒體信息上。不管視頻信息的表達形式或壓縮形式如何,具有這種標准化描述的多媒體數據均可被檢索。因此,MPEG-7的應用領域主要是數字化圖書館和廣播式媒體。
※H.263編碼
H.261編碼是一種幀間預測減少時域冗餘、變換編碼減少空域冗餘的混合編碼方法,具有壓縮比高、演算法復雜度低等優點,得到較為廣泛的應用。Mbone的重要應用工具之一IVS的視頻編碼採用的就是H.261編碼演算法。在H.261的基礎上,1996年ITU-T推出了H.263編碼標准。H.263在許多方面對H.261進行了改進和擴充,如在編碼演算法復雜度增加很少的基礎上,H.263能提供更好的圖像質量、更低的速率,十分適合於IP視頻會議、可視電話應用。目前,H.263編碼是IP視頻通信採用最多的一種編碼方法,並已被許多多媒體通信終端標准所吸收, 如:ITU-TH.310(B-ISDN)、H.320(ISDN)、H.324(PSTN)、H.323(LAN、 WAN、Internet)。
隨著計算機性能的快速提高,對於可視電話和視頻會議等應用(一般使用QCIF圖像),純軟體編碼器(codec)即可以滿足應用要求。我們實現的H.263純軟體編碼器在主頻為166MHz的主機上編碼幀率可達60幀/秒以上,平均圖像質量(用信噪比表示)大於38dB。
1998年ITU-T推出的H.263+是H.263建議的第二版,它提供了12個新的可協商模式和其他特徵,進一步提高了壓縮編碼性能。如H.263隻有5種視頻源格式,H.263+允許使用更多的源格式,圖像形狀和時鍾頻率也有多種選擇,拓寬了應用范圍;另一重要的改進是可擴展性,它允許多顯示率、多速率及多解析度,增強了視頻信息在易誤碼、易丟包異構網路環境下的傳輸。另外,H.263+的圖像分段依賴性也可以是受限的,以減少差錯傳播。H.263+對H.263中的不受限運動矢量模式進行了改進,加上12個新增的可選模式,不僅提高了編碼性能,而且增強了應用的靈活性
希望可以用到
⑩ 圖像壓縮原理
1、為什麼要對圖像數據進行壓縮?其壓縮原理是什麼?
答:(1)數字圖像如果不進行壓縮,數據量是比較大的,例如一幅解析度為1024×768的靜態真彩色圖像,其數據量為1024×768×24=2.25(MB)。這無疑對圖像的存儲、處理、傳送帶來很大的困難。事實上,在圖像像素之間,無論在行方向還是列方向,都存在一定的相關性。也就是說,在一般圖像中都存在很大的相關性,即冗餘度。靜態圖像數據的冗餘包括:空間冗餘、時間冗餘、結構冗餘、知識冗餘和視覺冗餘、圖像區域的相同性冗餘、紋理的統計冗餘等。圖像壓縮編碼技術就是利用圖像數據固有的冗餘性和相乾性,將一個大的圖像數據文件轉換為較小的同性質的文件。
(2)其壓縮原理: 空間冗餘、時間冗餘、結構冗餘、和視覺冗餘。
2、圖像壓縮編碼的目的是什麼?目前有哪些編碼方法?
答:(1)視頻經過數字化處理後易於加密、抗干擾能力強、可再生中繼等諸多優點,但是由於數字化的視頻數據量十分巨大,不利於傳輸和存儲。若不經壓縮,數字視頻傳輸所需的高傳輸率和數字視頻存儲所需的巨大容量,將成為推廣數字電視視頻通信的最大障礙,這就是進行視頻壓縮編碼的目的。
(2)目前主要是預測編碼,變換編碼,和統計編碼三種編碼方法。
3、某信號源共有7個符號,概率分別為0.2,0.18,0.1,0.15,0.07,0.05,0.25,試進行霍夫曼編碼,並解釋是否進行了壓縮,壓縮比為多少?
0000 0001 000 00 111 110 10
0.05 0.07 0.1 0.2 0.18 0.15 0.25
0.05×4+0.07×4+0.1×3+0.2×2+0.18×3+0.15×3+0.25×2=2.67