導航:首頁 > 文件處理 > 壓縮編碼方法的優點

壓縮編碼方法的優點

發布時間:2022-12-13 14:30:30

A. 1.柵格數據存儲的壓縮編碼有幾種各有什麼優點和缺點

2.1.6 柵格數據存儲的壓縮編碼 1 直接編碼 直接柵格編碼是最簡單最直觀而又非常重要的一種柵格結構編碼方法,通常稱這種編碼為圖像文件或柵格文件。直接編碼就是將柵格數據看作一個數據矩陣,逐行(或逐列)逐個記錄代碼,可以每行都從左到右逐象元記錄,也可奇數行從左到右,而偶數行由右向左記錄,為了特定目的還可採用其它特殊的順序,右圖直接編碼可表示為矩陣: 2 鏈式編碼 鏈式編碼又稱為弗里曼鏈碼(Freeman,1961)或邊界鏈碼。由某一原點開始並按某些基本方向確定的單位矢量鏈。基本方向可定義為:東=0,南=3,西=2,北=1等。右圖多邊形邊如果確定原點為像元(10,1),則該多邊形界按順時方向的鏈式編碼為:

鏈式編碼對多邊形的表示具有很強的數據壓縮能力,且具有一定的運算功能,如面積和周長計算等,探測邊界急彎和凹進部分等都比較容易。但是,疊置運算如組合、相交等則很難實施,
3 行程編碼 行程編碼1 只在各行(或列)數據的代碼發生變化時依次記錄該代碼以及相同代碼重復的個數。左圖可沿行方向進行行程編碼: 行程編碼2 逐個記錄各行(或列)代碼發生變化的位置和相應的代碼,左圖可沿列方向進行行程編碼:
1列:(1,3),(3,1);
2列:(1,3),(4,1);
3列:(1,3),(5,1);
4列:(1,4),(2,3),(5,1);
5列:(1,4),(4,3),(6,2),(7,1);
6列:(1,4),(4,2);
7列:(1,4),(4,2);
8列:(1,4),(3,2)。 行程編碼3 按行(或列)記錄相同代碼的始末象元的列號(或行號)和相應的代碼,左圖可沿行方向進行程編碼:
4 塊式編碼 把多邊形范圍劃分成由象元組成的正方形,然後對各個正方形進行編碼。塊式編碼數據結構中包括3個數字:塊的初始位置(行、列號)和塊的大小(塊包括的象元數),再加上記錄單元的代碼組成。左圖塊式編碼:
5 四叉樹編碼2.1.6 柵格數據存儲的壓縮編碼 1 直接編碼 直接柵格編碼是最簡單最直觀而又非常重要的一種柵格結構編碼方法,通常稱這種編碼為圖像文件或柵格文件。直接編碼就是將柵格數據看作一個數據矩陣,逐行(或逐列)逐個記錄代碼,可以每行都從左到右逐象元記錄,也可奇數行從左到右,而偶數行由右向左記錄,為了特定目的還可採用其它特殊的順序,右圖直接編碼可表示為矩陣: 2 鏈式編碼 鏈式編碼又稱為弗里曼鏈碼(Freeman,1961)或邊界鏈碼。由某一原點開始並按某些基本方向確定的單位矢量鏈。基本方向可定義為:東=0,南=3,西=2,北=1等。右圖多邊形邊如果確定原點為像元(10,1),則該多邊形界按順時方向的鏈式編碼為: 鏈式編碼對多邊形的表示具有很強的數據壓縮能力,且具有一定的運算功能,如面積和周長計算等,探測邊界急彎和凹進部分等都比較容易。但是,疊置運算如組合、相交等則很難實施, 3 行程編碼 行程編碼1 只在各行(或列)數據的代碼發生變化時依次記錄該代碼以及相同代碼重復的個數。左圖可沿行方向進行行程編碼: 行程編碼2 逐個記錄各行(或列)代碼發生變化的位置和相應的代碼,左圖可沿列方向進行行程編碼:1列:(1,3),(3,1); 2列:(1,3),(4,1); 3列:(1,3),(5,1); 4列:(1,4),(2,3),(5,1); 5列:(1,4),(4,3),(6,2),(7,1); 6列:(1,4),(4,2); 7列:(1,4),(4,2); 8列:(1,4),(3,2)。 行程編碼3 按行(或列)記錄相同代碼的始末象元的列號(或行號)和相應的代碼,左圖可沿行方向進行程編碼: 4 塊式編碼 把多邊形范圍劃分成由象元組成的正方形,然後對各個正方形進行編碼。塊式編碼數據結構中包括3個數字:塊的初始位置(行、列號)和塊的大小(塊包括的象元數),再加上記錄單元的代碼組成。左圖塊式編碼: 5 四叉樹編碼 四叉樹分割 將圖像區域按四個大小相同的象限四等分,每個象限又可根據一定規則判斷是否繼續等分為次一層的四個象限,無論分割到哪一層象限,只要子象限上僅含一種屬性代碼或符合既定要求的少數幾種屬性時,則停止繼續分割。否則就一直分割到單個象元為止。按照象限遞歸分割的原則所分圖像區域的柵格陣列應為2n×2n(n為分割的層數)的形式。 四叉樹結構 把整個2n×2n象元組成的陣列當作樹的根結點,樹的高度為n級(最多為n級)。每個結點有分別代表南西(SW)、南東(SE)、北西(NW)、北東(NE)四個象限的四個分支。四個分支中要麼是樹葉,要麼是樹叉。樹葉代表不能繼續劃分的結點,該結點代表子象限具有單一的代碼;樹叉不只包含一種代在碼,必須繼續劃分,直到變成樹葉為止。 四叉樹編碼 1 指針四叉樹編碼 通過在子結點與父結點之間設立指針的方式建立起整個結構。按這種方式,四叉樹的每個結點通常存儲6個量,即四個子結點指針、一個父結點指針和該結點的屬性代碼。這種方法除了要記錄葉結點外,還要記錄中間結點,一般要佔用較大存儲空間。 2 線性四叉樹編碼 為美國馬里蘭大學地理信息系統中採用的編碼方法,該方法記錄每個終止結點(或葉結點)的地址和值,值就是子區的屬性代碼,其中地址包括兩部分,共32位(二進制),最右邊4位記錄該葉結點的深度,即處於四叉樹的第幾層上,有了深度可以推知子區大小;左邊的28位記錄路徑,從右邊第五位往左記錄從葉結點到根結點的路徑,0,1,2,3分別表示SW、SE、NW、NE。28位 4位 0 0 0 0 ... ... 0 0 0 0 1 1 1 0 0 0 1 1(路徑0SW,3NE,2NW) 0 3 2 深度3記錄了各個葉子的地址,再記錄相應代碼值,就記錄了整個圖像。 四叉樹優點 1.容易而有效地計算多邊形的數量特徵; 2.陣列各部分的解析度是可變的,邊界復雜部分四叉樹較高,即分級多,解析度也高,而不需要表示許多細節的部分則分級少,解析度低,因而既可精確表示圖形結構又可減少存儲量; 3.柵格到四叉樹及到四叉樹到簡單柵格結構的轉換比其他壓縮方法容易; 4.多邊形中嵌套異類多邊形的表示較方便。 四叉樹分割 將圖像區域按四個大小相同的象限四等分,每個象限又可根據一定規則判斷是否繼續等分為次一層的四個象限,無論分割到哪一層象限,只要子象限上僅含一種屬性代碼或符合既定要求的少數幾種屬性時,則停止繼續分割。否則就一直分割到單個象元為止。按照象限遞歸分割的原則所分圖像區域的柵格陣列應為2n×2n(n為分割的層數)的形式。 四叉樹結構 把整個2n×2n象元組成的陣列當作樹的根結點,樹的高度為n級(最多為n級)。每個結點有分別代表南西(SW)、南東(SE)、北西(NW)、北東(NE)四個象限的四個分支。四個分支中要麼是樹葉,要麼是樹叉。樹葉代表不能繼續劃分的結點,該結點代表子象限具有單一的代碼;樹叉不只包含一種代在碼,必須繼續劃分,直到變成樹葉為止。 四叉樹編碼 1 指針四叉樹編碼 通過在子結點與父結點之間設立指針的方式建立起整個結構。按這種方式,四叉樹的每個結點通常存儲6個量,即四個子結點指針、一個父結點指針和該結點的屬性代碼。這種方法除了要記錄葉結點外,還要記錄中間結點,一般要佔用較大存儲空間。 2 線性四叉樹編碼 為美國馬里蘭大學地理信息系統中採用的編碼方法,該方法記錄每個終止結點(或葉結點)的地址和值,值就是子區的屬性代碼,其中地址包括兩部分,共32位(二進制),最右邊4位記錄該葉結點的深度,即處於四叉樹的第幾層上,有了深度可以推知子區大小;左邊的28位記錄路徑,從右邊第五位往左記錄從葉結點到根結點的路徑,0,1,2,3分別表示SW、SE、NW、NE。
28位 4位
0 0 0 0 ... ... 0 0 0 0 1 1 1 0 0 0 1 1
(路徑0SW,3NE,2NW) 0 3 2 深度3
記錄了各個葉子的地址,再記錄相應代碼值,就記錄了整個圖像。 四叉樹優點 1.容易而有效地計算多邊形的數量特徵; 2.陣列各部分的解析度是可變的,邊界復雜部分四叉樹較高,即分級多,解析度也高,而不需要表示許多細節的部分則分級少,解析度低,因而既可精確表示圖形結構又可減少存儲量; 3.柵格到四叉樹及到四叉樹到簡單柵格結構的轉換比其他壓縮方法容易; 4.多邊形中嵌套異類多邊形的表示較方便。

B. prores編碼的優勢在哪裡它屬於什麼壓縮方式

prores功能
簡單來說ProRes是蘋果自家的一種低壓縮格式,存在的主要意義在於增加Mac剪輯時的流暢度。
其中細分為幾個格式,碼率不同,當然效果也有點差別。現在ProRes主要競爭對手是H264,ProRes整體來說編碼效率比較低,存儲空間佔用大,而H264正相反,以往由於電腦硬體性能的制約直接剪輯H264格式不太流暢,現在由於GPU加速的普及和代理剪輯功能的完善流暢度已經不是問題,ProRes有逐漸失寵的趨勢

C. 為什麼要使用視音頻壓縮編碼

減少視頻的大小優化其架構等.使其可以在各類設備上使用!以上是我個人見解.
希望我的的回答對你有幫助!

D. 監控視頻壓縮編解碼的介紹

(一)、M-JPEG
M-JPEG(Motion- Join Photographic Experts Group)技術即運動靜止圖像(或逐幀)壓縮技術,廣泛應用於非線性編輯領域可精確到幀編輯和多層圖像處理,把運動的視頻序列作為連續的靜止圖像來處理,這種壓縮方式單獨完整地壓縮每一幀,在編輯過程中可隨機存儲每一幀,可進行精確到幀的編輯,此外M-JPEG的壓縮和解壓縮是對稱的,可由相同的硬體和軟體實現。但M-JPEG只對幀內的空間冗餘進行壓縮。不對幀間的時間冗餘進行壓縮,故壓縮效率不高。採用M-JPEG數字壓縮格式,當壓縮比7:1時,可提供相當於Betecam SP質量圖像的節目。
JPEG標准所根據的演算法是基於DCT(離散餘弦變換)和可變長編碼。JPEG的關鍵技術有變換編碼、量化、差分編碼、運動補償、霍夫曼編碼和遊程編碼等
M-JPEG的優點是:可以很容易做到精確到幀的編輯、設備比較成熟。缺點是壓縮效率不高。
此外,M-JPEG這種壓縮方式並不是一個完全統一的壓縮標准,不同廠家的編解碼器和存儲方式並沒有統一的規定格式。這也就是說,每個型號的視頻伺服器或編碼板有自己的M-JPEG版本,所以在伺服器之間的數據傳輸、非線性製作網路向伺服器的數據傳輸都根本是不可能的。
(二)、MPEG系列標准
MPEG是活動圖像專家組(Moving Picture Exports Group)的縮寫,於1988年成立,是為數字視/音頻制定壓縮標準的專家組,目前已擁有300多名成員,包括IBM、SUN、BBC、NEC、INTEL、AT&T等世界知名公司。MPEG組織最初得到的授權是制定用於「活動圖像」編碼的各種標准,隨後擴充為「及其伴隨的音頻」及其組合編碼。後來針對不同的應用需求,解除了「用於數字存儲媒體」的限制,成為現在制定「活動圖像和音頻編碼」標準的組織。MPEG組織制定的各個標准都有不同的目標和應用,目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21標准。
1.MPEG-1標准
MPEG-1標准於1993年8月公布,用於傳輸1.5Mbps數據傳輸率的數字存儲媒體運動圖像及其伴音的編碼。該標准包括五個部分:
第一部分說明了如何根據第二部分(視頻)以及第三部分(音頻)的規定,對音頻和視頻進行復合編碼。第四部分說明了檢驗解碼器或編碼器的輸出比特流符合前三部分規定的過程。第五部分是一個用完整的C語言實現的編碼和解碼器。
該標准從頒布的那一刻起,MPEG-1取得一連串的成功,如VCD和MP3的大量使用,Windows95以後的版本都帶有一個MPEG-1軟體解碼器,可攜式MPEG-1攝像機等等。
2.MPEG-2標准
MPEG組織於1994年推出MPEG-2壓縮標准,以實現視/音頻服務與應用互操作的可能性。MPEG-2標準是針對標准數字電視和高清晰度電視在各種應用下的壓縮方案和系統層的詳細規定,編碼碼率從每秒3兆比特~100兆比特,標準的正式規范在ISO/IEC13818中。MPEG-2不是MPEG-1的簡單升級,MPEG-2在系統和傳送方面作了更加詳細的規定和進一步的完善。MPEG-2特別適用於廣播級的數字電視的編碼和傳送,被認定為SDTV和HDTV的編碼標准。
MPEG-2圖像壓縮的原理是利用了圖像中的兩種特性:空間相關性和時間相關性。這兩種相關性使得圖像中存在大量的冗餘信息。如果我們能將這些冗餘信息去除,只保留少量非相關信息進行傳輸,就可以大大節省傳輸頻帶。而接收機利用這些非相關信息,按照一定的解碼演算法,可以在保證一定的圖像質量的前提下恢復原始圖像。一個好的壓縮編碼方案就是能夠最大限度地去除圖像中的冗餘信息。
MPEG-2的編碼圖像被分為三類,分別稱為I幀,P幀和B幀。
I幀圖像採用幀內編碼方式,即只利用了單幀圖像內的空間相關性,而沒有利用時間相關性。P幀和B幀圖像採用幀間編碼方式,即同時利用了空間和時間上的相關性。P幀圖像只採用前向時間預測,可以提高壓縮效率和圖像質量。P幀圖像中可以包含幀內編碼的部分,即P幀中的每一個宏塊可以是前向預測,也可以是幀內編碼。B幀圖像採用雙向時間預測,可以大大提高壓縮倍數。
MPEG-2的編碼碼流分為六個層次。為更好地表示編碼數據,MPEG-2用句法規定了一個層次性結構。它分為六層,自上到下分別是:圖像序列層、圖像組(GOP)、圖像、宏塊條、宏塊、塊。
MPEG-2標准在廣播電視領域中的主要應用如下:
(1)視音頻資料的保存
一直以來,電視節目、音像資料等都是用磁帶保存的。這種方式有很多弊端:易損,佔地大,成本高,難於重新使用。更重要的是難以長期保存,難以查找、難以共享。隨著計算機技術和視頻壓縮技術的發展,高速寬頻計算機網路以及大容量數據存儲系統給電視台節目的網路化存儲、查詢、共享、交流提供了可能。
採用MPEG-2壓縮編碼的DVD視盤,給資料保存帶來了新的希望。電視節目、音像資料等可通過MPEG-2編碼系統編碼,保存到低成本的CD-R光碟或高容量的可擦寫DVD-RAM上,也可利用DVD編著軟體(如Daikin Scenarist NT、Spruce DVDMaestro等)製作成標準的DVD視盤,既可節約開支,也可節省存放空間。
(2)電視節目的非線性編輯系統及其網路
在非線性編輯系統中,節目素材是以數字壓縮方式存儲、製作和播出的, 視頻壓縮技術是非線性編輯系統的技術基礎。目前主要有M-JPEG和MPEG-2兩種數字壓縮格式。
M-JPEG技術即運動靜止圖像(或逐幀)壓縮技術,可進行精確到幀的編輯,但壓縮效率不高。
MPEG-2採用幀間壓縮的方式,只需進行I幀的幀內壓縮處理,B幀和P幀通過偵測獲得,因此 ,傳輸和運算的數據大多由幀之間的時間相關性得到,相對來說,數據量小,可以實現較高的壓縮比。隨著逐幀編輯問題的解決,MPEG-2將廣泛應用於非線性編輯系統,並大大地降低編輯成本,同時MPEG-2的解壓縮是標準的,不同廠家設計的壓縮器件壓縮的數據可由其他廠家設計解壓縮器來解壓縮,這一點保證了各廠家的設備之間能完全兼容。
由於採用MPEG-2 IBP視頻壓縮技術,數據量成倍減少,降低了存儲成本,提高了數據傳輸速度,減少了對計算機匯流排和網路帶寬的壓力,可採用純乙太網組建非線性編輯網路系統已成為可能,而在目前乙太網是最為成熟的網路,系統管理比較完善,價格也比較低廉。
基於MPEG-2的非線性編輯系統及非線性編輯網路將成為未來的發展方向。
(3)衛星傳輸
MPEG-2已經通過ISO認可,並在廣播領域獲得廣泛的應用,如數字衛星視頻廣播(DVB-S)、DVD視盤和視頻會議等。目前,全球有數以千萬計的DVB-S用戶,DVB-S信號採用MPEG-2壓縮格式編碼,通過衛星或微波進行傳輸,在用戶端經MPEG-2衛星接收解碼器解碼,以供用戶觀看。此外,採用MPEG-2壓縮編碼技術,還可以進行遠程電視新聞或節目的傳輸和交流。
(4)電視節目的播出
在整個電視技術中播出是一個承上啟下的環節,對播出系統進行數字化改造是非常必要的,其中最關鍵一步就是構建硬碟播出系統。MPEG-2硬碟自動播出系統因編播簡便、儲存容量大、視頻指標高等優點,而為人們所青睞。但以往MPEG-2播出設備因非常昂貴,而只有少量使用。隨著MPEG-2技術的發展和相關產品成本的下降,MPEG-2硬碟自動系統播出可望得到普及。
3.MPEG-4標准
運動圖像專家組MPEG 於1999年2月正式公布了MPEG-4(ISO/IEC14496)標准第一版本。同年年底MPEG-4第二版亦告底定,且於2000年年初正式成為國際標准。
MPEG-4與MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具體壓縮演算法,它是針對數字電視、互動式繪圖應用(影音合成內容)、互動式多媒體(WWW、資料擷取與分散)等整合及壓縮技術的需求而制定的國際標准。MPEG-4標准將眾多的多媒體應用集成於一個完整的框架內,旨在為多媒體通信及應用環境提供標準的演算法及工具,從而建立起一種能被多媒體傳輸、存儲、檢索等應用領域普遍採用的統一數據格式。
MPEG-4的編碼理念是:MPEG-4標准同以前標準的最顯著的差別在於它是採用基於對象的編碼理念,即在編碼時將一幅景物分成若干在時間和空間上相互聯系的視頻音頻對象,分別編碼後,再經過復用傳輸到接收端,然後再對不同的對象分別解碼,從而組合成所需要的視頻和音頻。這樣既方便我們對不同的對象採用不同的編碼方法和表示方法,又有利於不同數據類型間的融合,並且這樣也可以方便的實現對於各種對象的操作及編輯。例如,我們可以將一個卡通人物放在真實的場景中,或者將真人置於一個虛擬的演播室里,還可以在互聯網上方便的實現交互,根據自己的需要有選擇的組合各種視頻音頻以及圖形文本對象。
MPEG-4系統的一般框架是:對自然或合成的視聽內容的表示;對視聽內容數據流的管理,如多點、同步、緩沖管理等;對靈活性的支持和對系統不同部分的配置。
與MPEG-1、MPEG-2相比,MPEG-4具有如下獨特的優點:
(1) 基於內容的交互性
MPEG-4提供了基於內容的多媒體數據訪問工具,如索引、超級鏈接、上下載、刪除等。利用這些工具,用戶可以方便地從多媒體資料庫中有選擇地獲取自己所需的與對象有關的內容,並提供了內容的操作和位流編輯功能,可應用於互動式家庭購物,淡入淡出的數字化效果等。MPEG-4提供了高效的自然或合成的多媒體數據編碼方法。它可以把自然場景或對象組合起來成為合成的多媒體數據。
(2)高效的壓縮性
MPEG-4基於更高的編碼效率。同已有的或即將形成的其它標准相比,在相同的比特率下,它基於更高的視覺聽覺質量,這就使得在低帶寬的信道上傳送視頻、音頻成為可能。同時MPEG-4還能對同時發生的數據流進行編碼。一個場景的多視角或多聲道數據流可以高效、同步地合成為最終數據流。這可用於虛擬三維游戲、三維電影、飛行模擬練習等
(3)通用的訪問性
MPEG-4提供了易出錯環境的魯棒性,來保證其在許多無線和有線網路以及存儲介質中的應用,此外,MPEG-4還支持基於內容的的可分級性,即把內容、質量、復雜性分成許多小塊來滿足不同用戶的不同需求,支持具有不同帶寬,不同存儲容量的傳輸信道和接收端。
這些特點無疑會加速多媒體應用的發展,從中受益的應用領域有:網際網路多媒體應用;廣播電視;互動式視頻游戲;實時可視通信;互動式存儲媒體應用;演播室技術及電視後期製作;採用面部動畫技術的虛擬會議;多媒體郵件;移動通信條件下的多媒體應用;遠程視頻監控;通過ATM網路等進行的遠程資料庫業務等。MPEG-4主要應用如下:
(1)應用於網際網路視音頻廣播
由於上網人數與日俱增,傳統電視廣播的觀眾逐漸減少,隨之而來的便是廣告收入的減少,所以現在的固定式電視廣播最終將轉向基於TCP/IP的網際網路廣播,觀眾的收看方式也由簡單的遙控器選擇頻道轉為網上視頻點播。視頻點播的概念不是先把節目下載到硬碟,然後再播放,而是流媒體視頻(streaming video),點擊即觀看,邊傳輸邊播放。
現在網際網路中播放視音頻的有:Real Networks公司的 Real Media,微軟公司的 Windows Media,蘋果公司的 QuickTime,它們定義的視音頻格式互不兼容,有可能導致媒體流中難以控制的混亂,而MPEG-4為網際網路視頻應用提供了一系列的標准工具,使視音頻碼流具有規范一致性。因此在網際網路播放視音頻採用MPEG-4,應該說是一個安全的選擇。
(2)應用於無線通信
MPEG-4高效的碼率壓縮,交互和分級特性尤其適合於在窄帶移動網上實現多媒體通信,未來的手機將變成多媒體移動接收機,不僅可以打移動電視電話、移動上網,還可以移動接收多媒體廣播和收看電視。
(3)應用於靜止圖像壓縮
靜止圖像(圖片)在網際網路中大量使用,現在網上的圖片壓縮多採用JPEG技術。MPEG-4中的靜止圖像(紋理)壓縮是基於小波變換的,在同樣質量條件下,壓縮後的文件大小約是JPEG壓縮文件的十分之一。把網際網路上使用的JPEG圖片轉換成MPEG-4格式,可以大幅度提高圖片在網路中的傳輸速度。
(4)應用於電視電話
傳統用於窄帶電視電話業務的壓縮編碼標准,如H261,採用幀內壓縮、幀間壓縮、減少象素和抽幀等辦法來降低碼率,但編碼效率和圖像質量都難以令人滿意。MPEG-4的壓縮編碼可以做到以極低碼率傳送質量可以接受的聲像信號,使電視電話業務可以在窄帶的公用電話網上實現。
(5)應用於計算機圖形、動畫與模擬
MPEG-4特殊的編碼方式和強大的交互能力,使得基於MPEG-4的計算機圖形和動畫可以從各種來源的多媒體資料庫中獲取素材,並實時組合出所需要的結果。因而未來的計算機圖形可以在MPEG-4語法所允許的范圍內向所希望的方向無限發展,產生出今天無法想像的動畫及模擬效果。
(6)應用於電子游戲
MPEG-4可以進行自然圖像與聲音同人工合成的圖像與聲音的混合編碼,在編碼方式上具有前所未有的靈活性,並且能及時從各種來源的多媒體資料庫中調用素材。這可以在將來產生象電影一樣的電子游戲,實現極高自由度的互動式操作。
(三)H.264
H.264是ITU-T的VCEG(視頻編碼專家組)和ISO/IEC的MPEG(活動圖像編碼專家組)的聯合視頻組(JVT:joint video team)開發的一個新的數字視頻編碼標准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。1998年1月份開始草案徵集,1999年9月,完成第一個草案,2001年5月制定了其測試模式TML-8,2002年6月的 JVT第5次會議通過了H.264的FCD板。2003年3月正式發布。
H.264和以前的標准一樣,也是DPCM加變換編碼的混合編碼模式。但它採用回歸基本的簡潔設計,不用眾多的選項,獲得比H.263++好得多的壓縮性能;加強了對各種信道的適應能力,採用網路友好的結構和語法,有利於對誤碼和丟包的處理;應用目標范圍較寬,以滿足不同速率、不同解析度以及不同傳輸(存儲)場合的需求;它的基本系統是開放的,使用無需版權。
在技術上,H.264標准中有多個閃光之處,如統一的VLC符號編碼,高精度、多模式的位移估計,基於4×4塊的整數變換、分層的編碼語法等。這些措施使得H.264演算法具有很的高編碼效率,在相同的重建圖像質量下,能夠比H.263節約50%左右的碼率。H.264的碼流結構網路適應性強,增加了差錯恢復能力,能夠很好地適應IP和無線網路的應用。 H.264的演算法在概念上可以分為兩層:視頻編碼層(VCL:Video Coding Layer)負責高效的視頻內容表示,網路提取層(NAL:Network Abstraction Layer)負責以網路所要求的恰當的方式對數據進行打包和傳送。在VCL和NAL之間定義了一個基於分組方式的介面,打包和相應的信令屬於NAL的一部分。這樣,高編碼效率和網路友好性的任務分別由VCL和NAL來完成。
VCL層包括基於塊的運動補償混合編碼和一些新特性。與前面的視頻編碼標准一樣,H.264沒有把前處理和後處理等功能包括在草案中,這樣可以增加標準的靈活性。
NAL負責使用下層網路的分段格式來封裝數據,包括組幀、邏輯信道的信令、定時信息的利用或序列結束信號等。例如,NAL支持視頻在電路交換信道上的傳輸格式,支持視頻在Internet上利用RTP/UDP/IP傳輸的格式。NAL包括自己的頭部信息、段結構信息和實際載荷信息,即上層的VCL數據。(如果採用數據分割技術,數據可能由幾個部分組成)。 H.264支持1/4或1/8像素精度的運動矢量。在1/4像素精度時可使用6抽頭濾波器來減少高頻雜訊,對於1/8像素精度的運動矢量,可使用更為復雜的8抽頭的濾波器。在進行運動估計時,編碼器還可選擇增強內插濾波器來提高預測的效果。
在H.264的運動預測中,一個宏塊(MB)可以按圖2被分為不同的子塊,形成7種不同模式的塊尺寸。這種多模式的靈活和細致的劃分,更切合圖像中實際運動物體的形狀,大大提高了運動估計的精確程度。在這種方式下,在每個宏塊中可以包含有1、2、4、8或16個運動矢量。
在H.264中,允許編碼器使用多於一幀的先前幀用於運動估計,這就是所謂的多幀參考技術。例如2幀或3幀剛剛編碼好的參考幀,編碼器將選擇對每個目標宏塊能給出更好的預測幀,並為每一宏塊指示是哪一幀被用於預測。 H.264與先前的標准相似,對殘差採用基於塊的變換編碼,但變換是整數操作而不是實數運算,其過程和DCT基本相似。這種方法的優點在於:在編碼器中和解碼器中允許精度相同的變換和反變換,便於使用簡單的定點運算方式。也就是說,這里沒有反變換誤差。 變換的單位是4×4塊,而不是以往常用的8×8塊。由於用於變換塊的尺寸縮小,運動物體的劃分更精確,這樣,不但變換計算量比較小,而且在運動物體邊緣處的銜接誤差也大為減小。為了使小尺寸塊的變換方式對圖像中較大面積的平滑區域不產生塊之間的灰度差異,可對幀內宏塊亮度數據的16個4×4塊的DC系數(每個小塊一個,共16個)進行第二次4×4塊的變換,對色度數據的4個4×4塊的DC系數(每個小塊一個,共4個)進行2×2塊的變換。
H.264為了提高碼率控制的能力,量化步長的變化的幅度控制在12.5%左右,而不是以不變的增幅變化。變換系數幅度的歸一化被放在反量化過程中處理以減少計算的復雜性。為了強調彩色的逼真性,對色度系數採用了較小量化步長。 在先前的H.26x系列和MPEG-x系列標准中,都是採用的幀間預測的方式。在H.264中,當編碼Intra圖像時可用幀內預測。對於每個4×4塊(除了邊緣塊特別處置以外),每個像素都可用17個最接近的先前已編碼的像素的不同加權和(有的權值可為0)來預測,即此像素所在塊的左上角的17個像素。顯然,這種幀內預測不是在時間上,而是在空間域上進行的預測編碼演算法,可以除去相鄰塊之間的空間冗餘度,取得更為有效的壓縮。
如圖4所示,4×4方塊中a、b、...、p為16 個待預測的像素點,而A、B、...、P是已編碼的像素。如m點的值可以由(J+2K+L+2)/ 4 式來預測,也可以由(A+B+C+D+I+J+K+L)/ 8 式來預測,等等。按照所選取的預測參考的點不同,亮度共有9類不同的模式,但色度的幀內預測只有4類模式。 H.264 草案中包含了用於差錯消除的工具,便於壓縮視頻在誤碼、丟包多發環境中傳輸,如移動信道或IP信道中傳輸的健壯性。
為了抵禦傳輸差錯,H.264視頻流中的時間同步可以通過採用幀內圖像刷新來完成,空間同步由條結構編碼(slice structured coding)來支持。同時為了便於誤碼以後的再同步,在一幅圖像的視頻數據中還提供了一定的重同步點。另外,幀內宏塊刷新和多參考宏塊允許編碼器在決定宏塊模式的時候不僅可以考慮編碼效率,還可以考慮傳輸信道的特性。
除了利用量化步長的改變來適應信道碼率外,在H.264中,還常利用數據分割的方法來應對信道碼率的變化。從總體上說,數據分割的概念就是在編碼器中生成具有不同優先順序的視頻數據以支持網路中的服務質量QoS。例如採用基於語法的數據分割(syntax-based data partitioning)方法,將每幀數據的按其重要性分為幾部分,這樣允許在緩沖區溢出時丟棄不太重要的信息。還可以採用類似的時間數據分割(temporal data partitioning)方法,通過在P幀和B幀中使用多個參考幀來完成。
在無線通信的應用中,我們可以通過改變每一幀的量化精度或空間/時間解析度來支持無線信道的大比特率變化。可是,在多播的情況下,要求編碼器對變化的各種比特率進行響應是不可能的。因此,不同於MPEG-4中採用的精細分級編碼FGS(Fine Granular Scalability)的方法(效率比較低),H.264採用流切換的SP幀來代替分級編碼。
四、H.264的性能比較
TML-8為H.264的測試模式,用它來對H.264的視頻編碼效率進行比較和測試。測試結果所提供的PSNR已清楚地表明,相對於MPEG-4(ASP:Advanced Simple Profile)和H.263++(HLP:High Latency Profile)的性能,H.264的結果具有明顯的優越性。
H.264的PSNR比MPEG-4(ASP)和H.263++(HLP)明顯要好,在6種速率的對比測試中,H.264的PSNR比MPEG-4(ASP)平均要高2dB,比H.263(HLP)平均要高3dB。6個測試速率及其相關的條件分別為:32 kbit/s速率、10f/s幀率和QCIF格式;64 kbit/s速率、15f/s幀率和QCIF格式;128kbit/s速率、15f/s幀率和CIF格式;256kbit/s速率、15f/s幀率和QCIF格式;512 kbit/s速率、30f/s幀率和CIF格式;1024 kbit/s速率、30f/s幀率和CIF格式。

E. 急求圖像壓縮編碼方法!!!

以下是幾種格式的專業解釋:

HDTV

一,HDTV的概念

要解釋HDTV,我們首先要了解DTV。DTV是一種數字電視技術,是目前傳統模擬電視技術的接班人。所謂的數字電視,是指從演播室到發射、傳輸、接收過程中的所有環節都是使用數字電視信號,或對該系統所有的信號傳播都是通過由二進制數字所構成的數字流來 完成的。數字信號的傳播速率為每秒19.39兆位元組,如此大的數據流傳輸速度保證了數字電視的高清晰度,克服了模擬電視的先天不足。同時,由於數字電視可以允許幾種制式信號的同時存在,因此每個數字頻道下又可分為若干個子頻道,能夠滿足以後頻道不斷增多的 需求。HDTV是DTV標准中最高的一種,即High Definision TV,故而稱為HDTV。

二,HDTV中要求音、視頻信號達到哪些標准?

HDTV規定了視頻必須至少具備720線非交錯式(720p,即常說的逐行)或1080線交錯式隔行(1080i,即常說的隔行)掃描(DVD標准為 480線),屏幕縱橫比為16:9。音頻輸出為5.1聲道(杜比數字格式),同時能兼容接收其它較低格式的 信號並進行數字化處理重放。

HDTV有三種顯示格式,分別是:720P(1280×720P,非交錯式),1080 i(1920×1080i,交錯式),1080P(1920×1080i,非交錯式),其中網路上流傳的以720P和1080 i最為常見,而在微軟WMV-HD站點上1080P的樣片相對較多。

三,如何收看HDTV節目?

目前有兩種方式可欣賞到HDTV節目。一種是在電視上實時收看HDTV,需要滿足兩個條件,首先是電視可接收到HDTV信號,這需要額外添加相關的硬體,其次是電視符合HDTV標准,主要是指電視的解析度和接收埠而言。
另一種是在電腦上通過軟體播放。目前我國只有極少部分地區可接收到HDTV數字信號,而且HDTV電視的價格仍高高在上,不是普通消費者所能承受的。因此,在網路中找尋HDTC源,下載後在個人電腦上播放,成了大多數HDTV迷們的一個嘗鮮方法。

四,哪些是可用於電腦播放的HDTV文件?

網路中流傳的HDTV主要以兩類文件的方式存在,一類是經過MPEG-2標准壓縮,以.tp和.ts為後綴的視頻流文件,一類是經過WMV-HD (Windows Media Video High Definition)標准壓縮過的.wmv文件,還有少數文件後綴為.avi或.mpg,其性質與.wmv是完全一樣的。

HDTV文件都比較大,即使是經過重新編碼過後的.wmv文件也非同小可。以一部普通電影的時間長度來計算,.wmv文件將會有4G以上,而同樣時間長度的.tp和.ts文件能達到8G以上,有的甚至達到20多G。因此,除了通過文件後綴名,還可以通過文 件大小來判斷是否為HDTV文件。

五,如何在個人電腦上播放HDTV節目?

對於.wmv文件,只要系統安裝了Windows Media Player 9 或更高版本,就可以正常播放,一些播放軟體的最新版本已經開始支持WMV-HD,如WINDVD6等,也可以直接使用這些軟體播放HDTV。有些HDTV文件在壓縮過程中採用了其它標準的編碼格式,就需要安裝對應的解碼器,遇到Windows Media Player 9不能正常播放時,可以再安裝ffdshow,它帶有各種最常用的解碼器。

播放以.tp和.ts為後綴的視頻流文件要稍微麻煩一點,因為文件中分別包含有AC3音頻信息和MPEG-2視頻信息。好在現下有已經不少專門播放.tp 和.ts文件的軟體問世了,Moonlight-Elecard MPEG Player 就是其中一款比較常見的支持HDTV播放的軟體,目前最新的版本為2.x。安裝完後,也可以運行其它播放軟體來調用Moonlight- Elecard MPEG Player的解碼器進行播放。

六,如何鑒別HDTV的顯示格式?

目前我們無法僅從文件名稱、大小上來判定一個HDTV文件的顯示格式是720P還是1080i,或是1080P,但是有不少軟體可以在播放時顯示影片的圖像信息,如WINDVD、zplay等,在軟體的控制面板中選擇對應的選項就可以看到詳細的信息。

七,為什麼我只能看到圖像,卻聽不到聲音?

這是因為未安裝AC3音頻解碼器,導致HDTV文件中的音頻信息不能被正確識別的原因。解決的方法是下載並安裝對應的音頻解碼器,常用的有 AC3Filter,這些音、視頻解碼器只需安裝一次即可,播放HDTV文件時系統會自動調用,而不必每次播 放的時候都打開其控制界面。

八,為什麼我播放HDTV時會出現丟幀現象?

在家用電腦上播放HDTV,對其硬體配置要求較高,主要是與CPU、顯存、內存緊緊相關,如果這三樣中有一樣性能過低,就會產生一些播放問題。播放 HDTV時會出現丟幀現象是顯存容量不夠造成的,尤其是在播放1080 i格式HDTV的時候,1920×1080的像素量,需要足夠大的顯存才能滿足其數據吞吐,因此顯存至少需要64M以上,建議128M。由於是2D顯示,所以對顯卡核心的運算能力要求反而不是很高。

九,為什麼我播放HDTV時會經常出現畫面和語音停頓的現象?

一些採用了WMV-HD重新編碼的HDTV文件,因為有著較高的壓縮率,在播放時就需要非常高的CPU運算能力來進行實時解碼,一般來說P4 2.0G/AMD 2000 以上及同級別的CPU可達到這個要求。同時,由於HDTV的數據流較大,需要足夠的內存來支持,推薦在256M以上。如果你的電腦滿足不了這樣的配置,就可能會在播放過程中產生畫面與語音不同步、畫面經常停頓、爆音等現象。嚴重的話甚至無法順利觀看。如果 這種現象不太嚴重,則可以通過優化系統和一些小技巧來改善。

十,如何優化系統以保證順利地播放HDTV?

除非你的電腦硬體配置的確很強,否則就很可能需要對系統進行一些優化,以便可以順利地播放HDTV。首先是在播放HDTV前關閉所有沒有用的後台程序或進程,盡量增加系統的空閑資源為播放HDTV服務;其次是選擇一款佔用系統資源較低的軟體來播放HDTV 。Windows Media Player、WINDVD等軟體佔用系統資源較多,在硬體配置本就不高的系統上會影響HDTV的播放效果,這時可以選擇使用BSPlayer。 BSPlayer是一款免費軟體,最大的特點就是佔用系統資源很小,尤其在播放HDTV文件時,與其它幾個資源佔用大戶相比效果更為明顯。另外,運行播放軟體後立即打開任務管理器(僅在Windows 2000/XP中有效),將播放軟體的進程級別設置為最高,這樣也可以為HDTV的播放調用更多的系統資源。除此之外,安裝更高版本的 DirectX,也能更好地支持HDTV的播放。

十一,還有什麼其它的技巧?

如果你的PC可以流利地播放HDTV,那麼你唯一會感到遺憾的,可能就是抱怨顯示器太小和音箱太不夠勁了。音箱的問題沒有好的方法可以解決,必竟PC音箱和家庭影院的音箱兩者是不可同比的,然而我們可以通過調高顯示器的解析度來提高畫面的清晰度和細節感。 現在主流的顯示器為17寸純平CRT(因為改變標准解析度只會給LCD帶來負面影響,因此這種方法只針對普通的CRT顯示器),中低檔的17寸顯示器很難達到1600×1200以上的解析度,即使達到了其水平掃描率也在60Hz以下,但是請不要忘了,電視 信號的水平掃描率也就是在這個水平上。720P的水平掃描率為60Hz,1080i則有50Hz和60Hz兩種,分別為我國和美國地區的標准。也就是說,即使你在顯示器水平掃描率為60Hz的狀態下全屏觀看HDTV或DVD等其它視頻,你是感覺不到晃眼的 ,這主要是由於人眼對於動態和靜態物體的感應不同造成的。因此你可以在觀看HDTV的時候,放心地將顯示器水平掃描率設為60Hz,進而將解析度調高,平時使用再調回標准解析度即可。

存放HDTV文件的硬碟分區必須轉換為NTFS格式,因為一部HDTV電影通常是幾個4.3GB的視頻文件組成(為了方便刻錄在DVD上面),而FAT32是無法管理2GB以上的文件的,因此務必轉換分區格式。

H.264

JVT(Joint Video Team,視頻聯合工作組)於2001年12月在泰國Pattaya成立。它由ITU-T和ISO兩個國際標准化組織的有關視頻編碼的專家聯合組成。JVT的工作目標是制定一個新的視頻編碼標准,以實現視頻的高壓縮比、高圖像質量、良好的網路適應性等目標。目前JVT的工作已被ITU-T接納,新的視頻壓縮編碼標准稱為H.264標准,該標准也被ISO接納,稱為AVC(Advanced Video Coding)標准,是MPEG-4的第10部分。
H.264標准可分為三檔:
基本檔次(其簡單版本,應用面廣);
主要檔次(採用了多項提高圖像質量和增加壓縮比的技術措施,可用於SDTV、HDTV和DVD等);
擴展檔次(可用於各種網路的視頻流傳輸)。
H.264不僅比H.263和MPEG-4節約了50%的碼率,而且對網路傳輸具有更好的支持功能。它引入了面向IP包的編碼機制,有利於網路中的分組傳輸,支持網路中視頻的流媒體傳輸。H.264具有較強的抗誤碼特性,可適應丟包率高、干擾嚴重的無線信道中的視頻傳輸。H.264支持不同網路資源下的分級編碼傳輸,從而獲得平穩的圖像質量。H.264能適應於不同網路中的視頻傳輸,網路親和性好。

H.261是最早出現的視頻編碼建議,目的是規范ISDN網上的會議電視和可視電話應用中的視頻編碼技術。它採用的演算法結合了可減少時間冗餘的幀間預測和可減少空間冗餘的DCT變換的混合編碼方法。和ISDN信道相匹配,其輸出碼率是p×64kbit/s。p取值較小時,只能傳清晰度不太高的圖像,適合於面對面的電視電話;p取值較大時(如 p>6),可以傳輸清晰度較好的會議電視圖像。H.263 建議的是低碼率圖像壓縮標准,在技術上是H.261的改進和擴充,支持碼率小於64kbit/s的應用。但實質上H.263以及後來的H.263 和H.263 已發展成支持全碼率應用的建議,從它支持眾多的圖像格式這一點就可看出,如Sub-QCIF、QCIF、CIF、4CIF甚至16CIF等格式。
MPEG-1標準的碼率為1.2Mbit/s左右,可提供30幀CIF(352×288)質量的圖像,是為CD-ROM光碟的視頻存儲和播放所制定的。MPEG-l標准視頻編碼部分的基本演算法與H.261/H.263相似,也採用運動補償的幀間預測、二維DCT、VLC遊程編碼等措施。此外還引入了幀內幀(I)、預測幀(P)、雙向預測幀(B)和直流幀(D)等概念,進一步提高了編碼效率。在MPEG-1的基礎上,MPEG-2標准在提高圖像解析度、兼容數字電視等方面做了一些改進,例如它的運動矢量的精度為半像素;在編碼運算中(如運動估計和DCT)區分「幀」和「場」;引入了編碼的可分級性技術,如空間可分級性、時間可分級性和信噪比可分級性等。近年推出的MPEG-4標准引入了基於視聽對象(AVO:Audio-Visual Object)的編碼,大大提高了視頻通信的交互能力和編碼效率。 MPEG-4中還採用了一些新的技術,如形狀編碼、自適應DCT、任意形狀視頻對象編碼等。但是MPEG-4的基本視頻編碼器還是屬於和H.263相似的一類混合編碼器。
總之,H.261建議是視頻編碼的經典之作,H.263是其發展,並將逐步在實際上取而代之,主要應用於通信方面,但H.263眾多的選項往往令使用者無所適從。MPEG系列標准從針對存儲媒體的應用發展到適應傳輸媒體的應用,其核心視頻編碼的基本框架是和H.261一致的,其中引人注目的MPEG-4的「基於對象的編碼」部分由於尚有技術障礙,目前還難以普遍應用。因此,在此基礎上發展起來的新的視頻編碼建議H.264克服了兩者的弱點,在混合編碼的框架下引入了新的編碼方式,提高了編碼效率,面向實際應用。同時,它是兩大國際標准化組織的共同制定的,其應用前景應是不言而喻的。
JVT的H.264
H.264是ITU-T的VCEG(視頻編碼專家組)和ISO/IEC的MPEG(活動圖像編碼專家組)的聯合視頻組(JVT:joint video team)開發的一個新的數字視頻編碼標准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。1998年1月份開始草案徵集,1999年9月,完成第一個草案,2001年5月制定了其測試模式TML-8,2002年6月的 JVT第5次會議通過了H.264的FCD板。2003年3月正式發布。
H.264和以前的標准一樣,也是DPCM加變換編碼的混合編碼模式。但它採用「回歸基本」的簡潔設計,不用眾多的選項,獲得比H.263 好得多的壓縮性能;加強了對各種信道的適應能力,採用「網路友好」的結構和語法,有利於對誤碼和丟包的處理;應用目標范圍較寬,以滿足不同速率、不同解析度以及不同傳輸(存儲)場合的需求;它的基本系統是開放的,使用無需版權。
在技術上,H.264標准中有多個閃光之處,如統一的VLC符號編碼,高精度、多模式的位移估計,基於4×4塊的整數變換、分層的編碼語法等。這些措施使得H.264演算法具有很的高編碼效率,在相同的重建圖像質量下,能夠比H.263節約50%左右的碼率。H.264的碼流結構網路適應性強,增加了差錯恢復能力,能夠很好地適應IP和無線網路的應用。
H.264的技術亮點
(1) 分層設計
H.264的演算法在概念上可以分為兩層:視頻編碼層(VCL:Video Coding Layer)負責高效的視頻內容表示,網路提取層(NAL:Network Abstraction Layer)負責以網路所要求的恰當的方式對數據進行打包和傳送。在VCL和NAL之間定義了一個基於分組方式的介面,打包和相應的信令屬於NAL的一部分。這樣,高編碼效率和網路友好性的任務分別由VCL和NAL來完成。
VCL層包括基於塊的運動補償混合編碼和一些新特性。與前面的視頻編碼標准一樣,H.264沒有把前處理和後處理等功能包括在草案中,這樣可以增加標準的靈活性。
NAL負責使用下層網路的分段格式來封裝數據,包括組幀、邏輯信道的信令、定時信息的利用或序列結束信號等。例如,NAL支持視頻在電路交換信道上的傳輸格式,支持視頻在Internet上利用RTP/UDP/IP傳輸的格式。NAL包括自己的頭部信息、段結構信息和實際載荷信息,即上層的VCL數據。(如果採用數據分割技術,數據可能由幾個部分組成)。
(2) 高精度、多模式運動估計
H.264支持1/4或1/8像素精度的運動矢量。在1/4像素精度時可使用6抽頭濾波器來減少高頻雜訊,對於1/8像素精度的運動矢量,可使用更為復雜的8抽頭的濾波器。在進行運動估計時,編碼器還可選擇「增強」內插濾波器來提高預測的效果。
在H.264的運動預測中,一個宏塊(MB)可以按圖2被分為不同的子塊,形成7種不同模式的塊尺寸。這種多模式的靈活和細致的劃分,更切合圖像中實際運動物體的形狀,大大提高了運動估計的精確程度。在這種方式下,在每個宏塊中可以包含有1、2、4、8或16個運動矢量。
在H.264中,允許編碼器使用多於一幀的先前幀用於運動估計,這就是所謂的多幀參考技術。例如2幀或3幀剛剛編碼好的參考幀,編碼器將選擇對每個目標宏塊能給出更好的預測幀,並為每一宏塊指示是哪一幀被用於預測。
(3) 4×4塊的整數變換
H.264與先前的標准相似,對殘差採用基於塊的變換編碼,但變換是整數操作而不是實數運算,其過程和DCT基本相似。這種方法的優點在於:在編碼器中和解碼器中允許精度相同的變換和反變換,便於使用簡單的定點運算方式。也就是說,這里沒有「反變換誤差」。變換的單位是4×4塊,而不是以往常用的8×8塊。由於用於變換塊的尺寸縮小,運動物體的劃分更精確,這樣,不但變換計算量比較小,而且在運動物體邊緣處的銜接誤差也大為減小。為了使小尺寸塊的變換方式對圖像中較大面積的平滑區域不產生塊之間的灰度差異,可對幀內宏塊亮度數據的16個4×4塊的DC系數(每個小塊一個,共16個)進行第二次4×4塊的變換,對色度數據的4個4×4塊的DC系數(每個小塊一個,共4個)進行2×2塊的變換。
H.264為了提高碼率控制的能力,量化步長的變化的幅度控制在12.5%左右,而不是以不變的增幅變化。變換系數幅度的歸一化被放在反量化過程中處理以減少計算的復雜性。為了強調彩色的逼真性,對色度系數採用了較小量化步長。
(4) 統一的VLC
H.264中熵編碼有兩種方法,一種是對所有的待編碼的符號採用統一的VLC(UVLC :Universal VLC),另一種是採用內容自適應的二進制算術編碼(CABAC:Context-Adaptive Binary Arithmetic Coding)。CABAC是可選項,其編碼性能比UVLC稍好,但計算復雜度也高。UVLC使用一個長度無限的碼字集,設計結構非常有規則,用相同的碼表可以對不同的對象進行編碼。這種方法很容易產生一個碼字,而解碼器也很容易地識別碼字的前綴,UVLC在發生比特錯誤時能快速獲得重同步。
圖3顯示了碼字的語法。這里,x0,x1,x2,…是INFO比特,並且為0或1。圖4列出了前9種碼字。如:第4號碼字包含INFO01,這一碼字的設計是為快速再同步而經過優化的,以防止誤碼。
(5) 幀內預測
在先前的H.26x系列和MPEG-x系列標准中,都是採用的幀間預測的方式。在H.264中,當編碼Intra圖像時可用幀內預測。對於每個4×4塊(除了邊緣塊特別處置以外),每個像素都可用17個最接近的先前已編碼的像素的不同加權和(有的權值可為0)來預測,即此像素所在塊的左上角的17個像素。顯然,這種幀內預測不是在時間上,而是在空間域上進行的預測編碼演算法,可以除去相鄰塊之間的空間冗餘度,取得更為有效的壓縮。
如圖4所示,4×4方塊中a、b、...、p為16 個待預測的像素點,而A、B、...、P是已編碼的像素。如m點的值可以由(J+2K+L+2)/ 4 式來預測,也可以由(A B C D I J K L)/ 8 式來預測,等等。按照所選取的預測參考的點不同,亮度共有9類不同的模式,但色度的幀內預測只有1類模式。
(6) 面向IP和無線環境
H.264 草案中包含了用於差錯消除的工具,便於壓縮視頻在誤碼、丟包多發環境中傳輸,如移動信道或IP信道中傳輸的健壯性。
為了抵禦傳輸差錯,H.264視頻流中的時間同步可以通過採用幀內圖像刷新來完成,空間同步由條結構編碼(slice structured coding)來支持。同時為了便於誤碼以後的再同步,在一幅圖像的視頻數據中還提供了一定的重同步點。另外,幀內宏塊刷新和多參考宏塊允許編碼器在決定宏塊模式的時候不僅可以考慮編碼效率,還可以考慮傳輸信道的特性。
除了利用量化步長的改變來適應信道碼率外,在H.264中,還常利用數據分割的方法來應對信道碼率的變化。從總體上說,數據分割的概念就是在編碼器中生成具有不同優先順序的視頻數據以支持網路中的服務質量QoS。例如採用基於語法的數據分割(syntax-based data partitioning)方法,將每幀數據的按其重要性分為幾部分,這樣允許在緩沖區溢出時丟棄不太重要的信息。還可以採用類似的時間數據分割(temporal data partitioning)方法,通過在P幀和B幀中使用多個參考幀來完成。
在無線通信的應用中,我們可以通過改變每一幀的量化精度或空間/時間解析度來支持無線信道的大比特率變化。可是,在多播的情況下,要求編碼器對變化的各種比特率進行響應是不可能的。因此,不同於MPEG-4中採用的精細分級編碼FGS(Fine Granular Scalability)的方法(效率比較低),H.264採用流切換的SP幀來代替分級編碼。
H.264的性能測試
TML-8為H.264的測試模式,用它來對H.264的視頻編碼效率進行比較和測試。測試結果所提供的PSNR已清楚地表明,相對於MPEG-4(ASP:Advanced Simple Profile)和H.263 (HLP:High Latency Profile)的性能,H.264的結果具有明顯的優越性,如圖5所示。
H.264的PSNR比MPEG-4(ASP)和H.263 (HLP)明顯要好,在6種速率的對比測試中,H.264的PSNR比MPEG-4(ASP)平均要高2dB,比H.263(HLP)平均要高3dB。6個測試速率及其相關的條件分別為:32 kbit/s速率、10f/s幀率和QCIF格式;64 kbit/s速率、15f/s幀率和QCIF格式;128kbit/s速率、15f/s幀率和CIF格式;256kbit/s速率、15f/s幀率和QCIF格式;512 kbit/s速率、30f/s幀率和CIF格式;1024 kbit/s速率、30f/s幀率和CIF格式。
實現難度
對每個考慮實際應用的工程師而言,在關注H.264的優越性能的同時必然會衡量其實現難度。從總體上說,H.264性能的改進是以增加復雜性為代價而獲得的。目前全球也只有中國杭州海康威視數字技術有限公司在安防領域實現了H.264的實際應用,這一次我們走到了世界的前端!

1080p

1080P是標准層面上的HDTV或者硬體層面上FULL HD的最高標准之一,而FULL HD就是能夠完全顯示1920*1080像素或者說物理解析度達到1920*1080的平板電視機。需要注意的是,FULL HD和先前很多廠家宣傳的1080P並不是同樣的概念。
但是我們走進賣場會發現大多數品牌商家都打著1080P的旗幟對外宣傳,多少對我們的選購產生了阻礙.其實目前市場中的大多數平板電視都不是FULL HD,所謂的1080P只是支持1080P信號的接收並通過計算演變在屏幕上顯示,大多數大屏幕平板電視都為1366*768,等離子中的部分產品更低,要達到FULL HD的概念,就必須屏幕達到1920*1080的物理解析度以及至少30Hz的刷新率.

WAF

We Are Family 的簡稱 [我們是一家人]
WAF是韓國的一個影視製作小組,他們製作的DVDRIP是目前網上除了HDTV之外質量最好的,清晰度和音質都是上乘之作。
WAF的作品有以下特點:
1:嚴格控制每CD的容量,每CD的容量大小一般不超過0.05M(大家見過不少CD1是702M,CD2卻是698M的現象吧)。
2:經過控制的容量,利於刻盤,(有些小組製作的容量經常可以超過702M,一CD盤的容量,這時候超刻技術就受重視了^_^)
3:分割片子時注意場景轉換,極少造成一段場景有分裂感(例如4CD的《特洛伊》和4CD的《黑鷹》)。
4:每個片子壓制的尺寸都以OAR為准,即導演原始版。
5:尺寸統一,幾乎都是800線。(例:WAF20CD DTS版BOB,800*448,見過15CD的HDTVRIP版,居然有兩種尺寸!)我不清楚,一部大片為什麼大家會忍受得了解析度為640甚至以下的版本?
6:有極強的負責任的製作態度,發現有瑕疵的一般都會推出修復版.
7:喜歡WAF的DTS和AC3音頻和高碼率壓縮的視頻.
8:WAF每部片分割成的CD數一般都比別的小組製作的要多,這是為了保證必要的畫質和音質的質量。試想想有個加長版《角鬥士》使用DTS音軌,卻只分割成2CD,每CD有70多分鍾長,不知這樣壓縮出來的片子畫質能好到什麼程度?
所以說,WAF小組出品的DVDRip一般都是網上最清晰的版本。

問題補充:

普通家用電視的解析度是多少?是不是屏幕越大解析度越高?

電視的NTSC標准為720x480 刷新率為60Hz , PAL為720x576,刷新率為50Hz。 我國電視廣播採用 PAL制。

逐行電視接收隔行信號經過差補後可以達到逐行輸出,同時75Hz刷新率 ,或者隔行輸出,同時100Hz刷新率。

雖然PAL制可達576線,但普通電視的實際可分辨水平線數只有300~500。高清電視理論上可達720P 和1080i,就是說最多逐行720線。所以按理論來說,搞清電視用1024x768的VGA輸入也勉強可以表現出來了,但實際因為聚焦不準,文字顯示比能顯示1024x768的顯示器差很多,畫面顯示則沒什麼問題。

HDTV是不是沒有經過壓縮,最原始的視頻?

網路中流傳的HDTV主要以兩類文件的方式存在,一類是經過MPEG-2標准壓縮,以.tp和.ts為後綴的視頻流文件,一類是經過WMV-HD (Windows Media Video High Definition)標准壓縮過的.wmv文件,還有少數文件後綴為.avi或.mpg,其性質與.wmv是完全一樣的。

H.264等壓縮格式是不是為了方便網上傳播?

在技術上,H.264標准中有多個閃光之處,如統一的VLC符號編碼,高精度、多模式的位移估計,基於4塊的整數變換、分層的編碼語法等。這些措施使得H.264得演算法具有很高的編碼效率,在相同的重建圖像質量下,能夠比H.263節約50%左右的碼率。H.264的碼流結構網路適應性強,增加了差錯恢復能力,能夠很好地適應IP和無線網路的應用。

H.264能以較低的數據速率傳送基於聯網協議(IP)的視頻流,在視頻質量、壓縮效率和數據包恢復丟失等方面,超越了現有的MPEG-2、MPEG-4和H.26x視頻通訊標准,更適合窄帶傳輸。

網上流傳的Rip格式是什麼意思?DVDRip

DVDRip理解:其實就是一種DVD的備份技術。

DVD我們都知道,目前非常優秀的媒體格式,MPEG2編碼的視頻;AC3、DTS的音軌。但是我們也知道DVD載體是DVD光碟,D5一張就有4.7G。顯然,直接將DVD文件進行網路傳送毫無實際價值可言,將這樣的文件打包傳到伺服器上只會佔用伺服器的硬碟和大量的網路帶寬。還沒有多少人的網路帶寬可以讓他毫不動容地去下載一個7、8GB的文件只為了看兩個小時電影,更不要說將它們保存下來,DVD刻錄機這樣的產品目前也不是一般人能擁有的。
這就需要rip了,將DVD的視頻、音頻、字幕剝離出來,再經過壓縮或者其他處理,然後重新合成成多媒體文件。在更小的文件尺寸上達到DVD的是視聽享受。

F. 數字壓縮技術的優點是什麼

數字壓縮技術,可降低表達一條信息無論是文件、靜止圖像、電影或聲音所需的數字碼(1和0的數字串)的數量。數字傳輸對傳輸視頻信息至關重要,因為數字化的視頻信息佔用大量的空間。例如,只有4秒鍾長的數字化電影會占滿100兆位元組的硬驅空間。如果不加以壓縮,一部標准長度的故事片會充滿350多盤普通光碟。為了實現壓縮,在從一幀至另一幀的畫面中,只錄下變化的部分,而不變的(如背景)則只錄下一次。目前尚不存在的一項關鍵技術是所謂的家用信息電器,它可與「信息高速公路」相接,支持所有擬議中的視頻和文字應用,並且像電話和電視機一樣使用方便。

G. 多媒體的壓縮編碼

被國際社會廣泛認可和應用的通用壓縮編碼標准大致有如下四種:H.261、JPEG、 MPEG和DVI。
★ H.261:由CCITT(國際電報電話咨詢委員會)通過的用於音頻視頻服務的視頻編碼解碼器(也稱Px64標准),它使用兩種類型的壓縮:一幀中的有損壓縮(基於DCT)和用於幀間壓縮的無損編碼,並在此基礎上使編碼器採用帶有運動估計的DCT和DPCM(差分脈沖編碼調制)的混合方式。這種標准與JPEG及MPEG標准間有明顯的相似性,但關鍵區別是它是為動態使用設計的,並提供完全包含的組織和高水平的交互控制。
★ JPEG:全稱是Joint Photogragh Coding Experts Group(聯合照片專家組),是一種基於DCT的靜止圖像壓縮和解壓縮演算法,它由ISO(國際標准化組織)和CCITT(國際電報電話咨詢委員會)共同制定,並在1992年後被廣泛採納後成為國際標准。它是把冗長的圖像信號和其它類型的靜止圖像去掉,甚至可以減小到原圖像的百分之一(壓縮比100:1)。但是在這個級別上,圖像的質量並不好;壓縮比為20:1時,能看到圖像稍微有點變化;當壓縮比大於20:1時,一般來說圖像質量開始變壞。
★ MPEG:是Moving Pictures Experts Group(動態圖像專家組)的英文縮寫,實際上是指一組由ITU和ISO制定發布的視頻、音頻、數據的壓縮標准。它採用的是一種減少圖像冗餘信息的壓縮演算法,它提供的壓縮比可以高達200:1,同時圖像和音響的質量也非常高。通常有三個版本:MPEG-1、MPEG-2、MPEG-4以適用於不同帶寬和數字影像質量的要求。它的三個最顯著優點就是兼容性好、壓縮比高(最高可達200:1)、數據失真小。
★ DVI:其視頻圖像的壓縮演算法的性能與MPEG-1相當,即圖像質量可達到VHS的水平,壓縮後的圖像數據率約為1.5Mb/s。為了擴大DVI技術的應用,Intel公司推出了DVI演算法的軟體解碼演算法,稱為Indeo技術,它能將為壓縮的數字視頻文件壓縮為五分之一到十分之一。

H. 什麼是無損壓縮它相對於mp3格式有那些優點

所謂無損壓縮格式,是利用數據的統計冗餘進行壓縮,可完全回復原始數據而不引起任何失真,但壓縮率是受到數據統計冗餘度的理論限制,一般為2:1到5:1.這類方法廣泛用於文本數據,程序和特殊應用場合的圖像數據(如指紋圖像,醫學圖像等)的壓縮。由於壓縮比的限制,僅使用無損壓縮方法是不可能解決圖像和數字視頻的存儲和傳輸的所有問題.經常使用的無損壓縮方法有 Shannon-Fano 編碼,Huffman 編碼,遊程(Run-length)編碼,LZW(Lempel-Ziv-Welch)編碼和算術編碼等。
所謂無損壓縮格式,顧名思義,就是毫無損失地將聲音信號進行壓縮的音頻格式。常見的像MP3、WMA等格式都是有損壓縮格式,相比於作為源的WAV文件,它們都有相當大程度的信號丟失,這也是它們能達到10%的壓縮率的根本原因。而無損壓縮格式,就好比用Zip或RAR這樣的壓縮軟體去壓縮音頻信號,得到的壓縮格式還原成WAV文件,和作為源的WAV文件是一模一樣的!但是如果用Zip或RAR來壓縮WAV文件的話,必須將壓縮包解壓後才能播放。而無損壓縮格式則能直接通過播放軟體實現實時播放,使用起來和MP3等有損格式一模一樣。總而言之,無損壓縮格式就是能在不犧牲任何音頻信號的前提下,減少WAV文件體積的格式。 無損壓縮的優勢:
1、100%的保存、沒有任何信號丟失
2、音質高,不受信號源的影響3、轉換方便

I. 聲音壓縮編碼有那些標准 Mp3屬於哪種壓縮編碼標准

音頻編碼的分類如下:
(1)基於音頻數據的統計特性進行編碼,其典型技術是波形編碼.其目標是使重建語音波形保持原波形的形狀.PCM(脈沖編碼調制)是最簡單最基本的編碼方法.它直接賦予抽樣點一個代碼,沒有進行壓縮,因而所需的存儲空間較大.為了減少存儲空間,人們尋求壓縮編碼技術.利用音頻抽樣的幅度分布規律和相鄰樣值具有相關性的特點,提出了差值量化(DPCM),自適應量化(APCM)和自適應預測編碼(ADPCM)等演算法,實現了數據的壓縮.波形編碼適應性強,音頻質量好,但壓縮比不大,因而數據率較高.
(2)基於音頻的聲學參數,進行參數編碼,可進一步降低數據率.其目標是使重建音頻保持原音頻的特性.常用的音頻參數有共振峰,線性預測系數,濾波器組等.這種編碼技術的優點是數據率低,但還原信號的質量較差,自然度低. 將上述兩種編碼演算法很好地結合起來,採用混合編碼的方法.這樣就能在較低的碼率上得到較高的音質.如碼本激勵線性預測編碼(CELP),多脈沖激勵線性預測編碼(MPLPC)等.
(3)基於人的聽覺特性進行編碼:從人的聽覺系統出發,利用掩蔽效應,設計心理聲學模型,從而實現更高效率的數字音頻的壓縮.其中以MPEG標准中的高頻編碼和DolbyAC-3最有影響.

MP3原本用於表述MPEG1 Layer 3,但是日常應用中已經發展至包含Layer 1, Layer 2以及Fraunhofer Institute所擴展的MPEG 2.5。MP3是得到最高認知度的編解碼器之一,在互聯網編解碼器中具有最大的用戶群。但是為達到近CD品質音頻,對某些難應付的內容需要高於192kbps速率。

J. 語音壓縮編碼基本概念

    通常把低於 64kbit/s 速率的語音編碼方法稱為語音壓縮編碼技術。

    常見的話音壓縮編碼方法有:

   僅由前鄰樣值進行預測稱為一階預測;由多個過去樣值進行預測稱為多階預測,預測表達式如下:
一階預測:

多階預測:

顯然多階預測的精度要高一些,但復雜度也高。

1)基本原理
    差值脈沖編碼調制 DPCM,是利用語音信號的相關性,對相鄰樣值的差值進行編碼。

其中, 為 時刻的樣值, 為前鄰時刻的樣值。
    對相鄰樣值的差值進行編碼,實際是對 樣值 與過去的樣值為基礎得到的 當前樣值的估值(預測值) 之間的差值進行量化編碼的。

2)DPCM的編碼速率
    樣值差值的動態范圍比樣值本身的動態范圍小得多,則量化電平較少,在保證話音質量要求下,可降低編碼速率。相比8位碼的1路數碼率為64kbit/s的PCM編碼,DPCM相對差值編4位碼,編碼速率為32kbit/s。

    為了容易實現,常採用固定預測器。輸入信號與預測信號的差值大,從而造成 誤差增大,話音質量受影響 。故為了提高DPCM方式的質量選擇採用 自適應 措施。

    在DPCM的基礎上增加 自適應預測 自適應量化

   將輸入的音頻信號的頻帶分成若干個連續的頻段,每個頻帶稱為子帶,然後針對各個子帶中的音頻信號採用不同的編碼方案以降低碼率,保證編碼質量,但復雜度偏高。比如對於低頻段採用較多的編碼位數,對於高頻段採用較少的編碼位數,整體上降低碼率。
   子帶編碼是波形編碼和頻域編碼的結合,是屬於混合編碼。

   將信號分為若干個子帶進行編碼有以下兩個優點:

   子帶編碼中,編碼所需要的總速率 I 為

其中, 為第 k 個子帶的抽樣頻率,每個樣值採用 位比特編碼。
比如若設等帶寬子帶寬編碼的編碼速率為



若各子帶樣值編碼比特數的平均值為R
則有:

例如,一個4個子帶的SBC系統,子帶分別為[0 800],[800 1600],[1600 2400],[2400 3200],即為等帶寬子帶編碼且每個子帶的帶寬為800Hz,如果忽略同步的邊帶信息,子帶的比特分配分別為3,2,1,0 比特/樣值(即每個子帶的編碼位數 ),則SBC編碼系統總的傳輸速率為

閱讀全文

與壓縮編碼方法的優點相關的資料

熱點內容
dvd光碟存儲漢子演算法 瀏覽:753
蘋果郵件無法連接伺服器地址 瀏覽:956
phpffmpeg轉碼 瀏覽:667
長沙好玩的解壓項目 瀏覽:140
專屬學情分析報告是什麼app 瀏覽:562
php工程部署 瀏覽:831
android全屏透明 瀏覽:730
阿里雲伺服器已開通怎麼辦 瀏覽:801
光遇為什麼登錄時伺服器已滿 瀏覽:300
PDF分析 瀏覽:482
h3c光纖全工半全工設置命令 瀏覽:139
公司法pdf下載 瀏覽:379
linuxmarkdown 瀏覽:349
華為手機怎麼多選文件夾 瀏覽:681
如何取消命令方塊指令 瀏覽:347
風翼app為什麼進不去了 瀏覽:776
im4java壓縮圖片 瀏覽:360
數據查詢網站源碼 瀏覽:148
伊克塞爾文檔怎麼進行加密 瀏覽:888
app轉賬是什麼 瀏覽:161