導航:首頁 > 源碼編譯 > 運動估計演算法matlab

運動估計演算法matlab

發布時間:2023-03-11 09:05:47

❶ 想要成為演算法工程師,要學習哪些課程一般是什麼專業的可以做

演算法工程師要求很高的數學水平和邏輯思維。需要學習高數,線性代數,離散數學,數據結構和計算機等課程。

專業要求:計算機、電子、通信、數學等專業。

演算法工程師簡介:

演算法工程師根據研究領域來分主要有音頻/視頻演算法處理、圖像技術方面的二維信息演算法處理和通信物理層、雷達信號處理、生物醫學信號處理等領域的一維信息演算法處理。

在計算機音視頻和圖形圖形圖像技術等二維信息演算法處理方面目前比較先進的視頻處理演算法:機器視覺成為此類演算法研究的核心。

另外還有2D轉3D演算法(2D-to-3D conversion),去隔行演算法(de-interlacing),運動估計運動補償演算法(Motion estimation/Motion Compensation),去噪演算法(Noise Rection)。

縮放演算法(scaling),銳化處理演算法(Sharpness),超解析度演算法(Super Resolution),手勢識別(gesture recognition),人臉識別(face recognition)。

以上內容參考:網路-演算法工程師

❷ 演算法工程師是做什麼的

演算法工程師是一個非常高端的職位;是非常緊缺的專業工程師,兼具前途和錢途!

專業要求:計算機、電子、通信、數學等相關專業;
學歷要求:本科及其以上的學歷,大多數是碩士學歷及其以上;
語言要求:英語要求是熟練,基本上能閱讀國外專業書刊;
必須掌握計算機相關知識,熟練使用模擬工具MATLAB等,必須會一門編程語言。

目前國內從事演算法研究的工程師不少,但是高級演算法工程師卻很少,是一個非常緊缺的專業工程師。演算法工程師根據研究領域來分主要有音頻/視頻演算法處理、圖像技術方面的二維信息演算法處理和通信物理層、雷達信號處理、生物醫學信號處理等領域的一維信息演算法處理。
在計算機音視頻和圖形圖形圖像技術等二維信息演算法處理方面目前比較先進的視頻處理演算法:機器視覺成為此類演算法研究的核心;另外還有2D轉3D演算法(2D-to-3D conversion),去隔行演算法(de-interlacing),運動估計運動補償演算法(Motion estimation/Motion Compensation),去噪演算法(Noise Rection),縮放演算法(scaling),銳化處理演算法(Sharpness),超解析度演算法(Super Resolution),手勢識別(gesture recognition),人臉識別(face recognition)。
在通信物理層等一維信息領域目前常用的演算法:無線領域的RRM、RTT,傳送領域的調制解調、信道均衡、信號檢測、網路優化、信號分解等。
另外數據挖掘、互聯網搜索演算法也成為當今的熱門方向。
演算法工程師逐漸往人工智慧方向發展。

❸ 運動估計的搜索演算法

匹配誤差函數,可以用各種優化方法進行最小化,這就需要我們開發出高效的運動搜索演算法,
主要的幾種演算法歸納如下: 為當前幀的一個給定塊確定最優位移矢量的全局搜索演算法方法是:在一個預先定義的搜索區域
內,把它與參考幀中所有的候選塊進行比較,並且尋找具有最小匹配誤差的一個。這兩個塊之間的
位移就是所估計的 MV,這樣做帶來的結果必然導致極大的計算量。
選擇搜索區域一般是關於當前塊對稱的,左邊和右邊各有 Rx 個像素,上邊和下邊各有 Ry個像素。
如果已知在水平和垂直方向運動的動態范圍是相同的,那麼 Rx=Ry=R。估計的精度是由搜索的步長決定的,步長是相鄰兩個候選塊在水平或者垂直方向上的距離。通常,沿著兩個方向使用相同的步長。在最簡單的情況下,步長是一個像素,稱為整數像素精度搜索,該種演算法也稱為無損搜索演算法。 由於在窮盡塊匹配演算法中搜索相應塊的步長不一定是整數,一般來說,為了實現 1/K像素步長,對參考幀必須進行 K倍內插。根據實驗證明,與整像素精度搜索相比,半像素精度搜索在估計精度上有很大提高,特別是對於低清晰度視頻。
但是,應用分數像素步長,搜索演算法的復雜性大大增加,例如,使用半像素搜索,搜索點的總數比整數像素精度搜索大四倍以上。
那麼,如何確定適合運動估計的搜索步長,對於視頻編碼的幀間編碼來說,即使得預測誤差最小化。 快速搜索演算法和全局搜索演算法相比,雖然只能得到次最佳的匹配結果,但在減少運算量方面效果顯著。
1) 二維對數搜索法
這種演算法的基本思路是採用大菱形搜索模式和小菱形搜索模式,步驟如圖 6.4.20 所示,從相應於零位移的位置開始搜索,每一步試驗菱形排列的五個搜索點。下一步,把中心移到前一步找到的最佳匹配點並重復菱形搜索。當最佳匹配點是中心點或是在最大搜索區域的邊界上時,就減小搜索步長(菱形的半徑) 。否則步長保持不變。當步長減小到一個像素時就到達了最後一步,並且在這最
後一步檢驗九個搜索點。初始搜索步長一般設為最大搜索區域的一半。
其後這類演算法在搜索模式上又做了比較多的改進,在搜索模式上採用了矩形模式,還有六邊形模式、十字形模式等等。
2) 三步搜索法
這種搜索的步長從等於或者略大於最大搜索范圍的一半開始。第一步,在起始點和周圍八個 「1」標出的點上計算匹配誤差,如果最小匹配誤差在起始點出現,則認為沒有運動;第二步,以第一步中匹配誤差最小的點(圖中起始點箭頭指向的「1」)為中心,計算以「2」標出的 8個點處的匹配誤差。注意,在每一步中搜索步長搜都比上一步長減少一半,以得到更准確的估計;在第三步以後就能得到最終的估計結果,這時從搜索點到中心點的距離為一個像素。
但是,上述一些快速演算法更適合用於估計運動幅度比較大的場合,對於部分運動幅度小的場合,它們容易落入局部最小值而導致匹配精度很差,已經有很多各種各樣的視頻流證明了這一點。
現在,針對這一缺點,國內外諸多專家學者也提出了相應的應對措施,特別是針對H.264編碼標准要求的一些快速演算法的改進,並取得卓越的效果。例如[7]中提到的基於全局最小值具有自適應性的快速演算法,這種演算法通過在每一搜索步驟選擇多個搜索結果,基於這些搜索結果之間的匹配誤差的不同得到的最佳搜索點,因而可以很好地解決落入局部最小值的問題。
[8]中提到一種適用於H.264的基於自適應搜索范圍的快速運動估計演算法,經過實驗證明對於如salesman等中小運動序列,其速度可接近全局搜索演算法的400倍,接近三步搜索演算法的4倍;而對於大運動序列,如table tennis,該演算法則會自動調節搜索點數以適應復雜的運動。當從總體上考察速度方面的性能時,可以看到,該演算法平均速度是全局搜索演算法的287.4倍,三步搜索的2.8倍。 分級搜索演算法的基本思想是從最低解析度開始逐級精度的進行不斷優化的運動搜索策略,首先取得兩個原始圖象幀的金子塔表示,從上到下解析度逐級變細,從頂端開始,選擇一個尺寸比較大的數據塊進行一個比較粗略的運動搜索過程,對在此基礎上進行亞抽樣(即通過降低數據塊尺寸(或提高抽樣解析度)和減少搜索范圍的辦法)進行到下一個較細的級來細化運動矢量,而一個新的搜索過程可以在上一級搜索到的最優運動矢量周圍進行。在亞抽樣的過程中也有著不同的抽樣方式和抽樣濾波器。這種方法的優點是運算量的下降比例比較大,而且搜索的比較全面。
缺點是由於亞抽樣或者濾波器的採用而使內存的需求增加,另外如果場景細節過多可能會容易落入局部最小點。 由於物體的運動千變萬化,很難用一種簡單的模型去描述,也很難用一種單一的演算法來搜索最佳運動矢量,因此實際上大多採用多種搜索演算法相組合的辦法,可以在很大程度上提高預測的有效性和魯棒性。
事實上,在運動估計時也並不是單一使用上述某一類搜索演算法,而是根據各類演算法的優點靈活組合採納。在運動幅度比較大的情況下可以採用自適應的菱形搜索法和六邊形搜索法,這樣可以大大節省碼率而圖象質量並未有所下降。在運動圖象非常復雜的情況下,採用全局搜索法在比特數相對來說增加不多的情況下使得圖象質量得到保證。 H.264 編碼標准草案推薦使用 1/4分數像素精度搜索。[6]中提到在整像素搜索時採用非對稱十字型多層次六邊形格點運動搜索演算法,然後採用鑽石搜索模型來進行分數像素精度運動估計。
解碼器要求傳送的比特數最小化,而復雜的模型需要更多的比特數來傳輸運動矢量,而且易受雜訊影響。因此,在提高視頻的編碼效率的技術中,運動補償精度的提高和比特數最小化是相互矛盾的,這就需要我們在運動估計的准確性和表示運動所用的比特數之間作出折中的選擇。它的效果與選用的運動模型是密切相關的。

❹ 誰能詳細介紹下無線視頻傳輸技術,越詳細越好

隨著移動通信業務的增加,無線通信已獲得非常廣泛的應用。無線網路除了提供語音服務之外,還提供多媒體、高速數據和視頻圖像業務。無線通信環境(無線信道、移動終端等)以及移動多媒體應用業務的特點對視頻圖像的視頻圖像編碼與傳輸技術已成為當今信息科學與技術的前沿課題。

1 無線視頻傳輸技術面臨的挑戰

數字視頻信號具有如下特點:

·數據量大

例如,移動可視電話一般採用QCIF解析度的圖像,它有176X144=25344像開綠燈。如果每個像素由24位來表示,一幀圖像的數據量依達594kbit。考慮到實時視頻圖像傳輸要求的幀頻(電視信號每秒25幀),數據傳輸速率將達到14.5Mbps!

·實時性要求高

人眼對視頻信號的基本要求是,延遲小,實時性好。而普通的數據通信對實時性的要求依比較低,因此相對普通數據通信而言,視頻通信要求更好的實時性。

無線環境則具有如下特點:

·無線信道資源有限

由於無線信道環境惡劣,有效的帶寬資源十分有限。實現大數據量的視頻信號的傳輸,尤其在面向大眾的無線可視應用中,無線信道的資源尤其緊張。

·無線網路是一個時變的網路

無線信道的物理特點決定了無線網路是一個時變的網路。

·無線視頻的Qos保障

在移動通信中,用戶的移動造成無線視頻的Qos保障十分復雜。

由此可以看出,視頻信號對傳輸的需要和無線環境的特點存在尖銳的矛盾,因此無線視頻傳輸面臨著巨大的挑戰。一般來說,無線視頻傳輸系統的研究設計目標如表1所示。

表1 無線視頻傳輸系統的主要性能指標和設計目標

性能指標 設計目標
視頻壓縮
視頻傳輸實時性
視頻恢復質量
視頻傳輸魯棒性
支持Qos的視頻業務 用盡量少的比特描述視頻圖像
更短的傳輸時延,更快的編碼速度
獲得用戶更滿意的視頻恢復質量
更好適應傳輸信道的誤比特干擾
提供和用戶支持費用相當的服務

事實上,表1中許多性能指標是相互制約的。例如,視頻圖像壓縮比的提高會增加編碼演算法的復雜度,因此會影響演算法的實時實現,並且可能降低視頻的恢復質量。

2 視頻壓縮編碼技術

視頻信息的數據量十分驚人,要在帶寬有限的無線網路上傳送,必須經過壓縮編碼。目前國際上存在兩大標准化組織——ITU-T和MPEG——專門研究視頻編碼方法,負責制公平統一的標准,方便各種視頻產品間的互通性。這些協議集中了學術界最優秀的成果。

除各種基於國際標準的編碼技術外,還有許多新技術的發展十分引人注目。

2.1 基於協議的視頻壓縮編碼技術

國際電信聯盟(ITU-T)已經制定的視頻編碼標准包括H.261(1990年)、H.263(1995年)、H.263+(1998年),2000年11月份將通過H.263++的最終文本。H.26X系列標準是專門用於低比特率視頻通信的視頻編碼標准,具有較高的壓縮比,因此特別適合於無線視頻傳輸的需要。它們採用的基本技術包括:DCT變換、運動補償、量化、熵編碼等。H.263+和H.263++中更增加考慮了較為惡劣的無線環境,設計了多種增強碼流魯棒性的方法,定義了分線編碼的語法規則。

MPEG制定的視頻編碼標准有MPEG-1(1990年)、MPEG-2(1994年)、MPEG-4(完善中)。其中MPEG-1、MPEG-2基本已經定稿,使用的基本技術和H.26X相同。MPEG-1、MPEG-2的特點在於針對的應用主要是數字存儲媒體,碼率高,它們並不適於無線視頻傳輸。人們熟知的VCD、DVD是MPEG-1、MPEG-2的典型應用。隨後,MPEG組織注意到了低比特率應用潛在的巨大市場,開始和ITU-T進行競爭。在MPEG-4的制定中,不僅考慮了高比特率應用,還特別包含了適於無線傳輸的低比特率應用。MPEG-4標準的最大特點是基於視頻對象的編碼方法。

無線通信終端是多種多樣的,其所處的網路結構、規模也是互異的。視頻碼流的精細可分級性(Fine Granularity Scalability)適應了傳輸環境的多樣性。

編碼協議並不提供完全齊備的解決方案。一般來說,協議內容主要包括碼流的語法結構、技術路線、解碼方法等,而並未嚴格規定其中一些關鍵演算法,如運動估計演算法、碼率控制演算法等。運動估計演算法在第3部分有較為詳細的介紹。碼率控制方案在第4部分有較為詳細的介紹。

2.2 其他視頻壓縮編碼技術

除上述基於協議的視頻標准之外,還有一些優秀的演算法由於商業的原因,暫時沒有被國際標准完全接納。典型的例子是DCT變換和小波變換之爭。雖然利用小波變換可以取得更好的圖像恢復質量,但是因為DCT變換使用較早,有很多商業產品的支持,因此小波變換很難在一夜之間取代DCT變換現有的地位。其他編碼方法如,分形編碼、基於模型的編碼方法、感興趣區優先編碼方法等也都取得了一定的成果,具有更強的壓縮能力。但是演算法實現過於復雜,達到完全實用尚有一段距離。

在基於小波的低比特率圖像壓縮演算法的研究中,根據小波圖像系數的空間分布特性,以及小波多解析度的視頻特點,人們引入矢量量化以充分利用小波圖像系數的相關性。根據傳統的運動補償難以與小波變換相結合這一情況,人們還提出了將空間二維幀內小波變換與時間軸一維小波變換相結合的三維小波變換方法。

人類的視覺是一種積極的感受行為,不僅與生理因素有關,還取決於心理因素。人們觀察與理解圖像時常常會不自覺地對某引起區域產生興趣。整幅圖像的視覺質量往往取決於感興趣區(ROI:Region of Interest)的圖像質量。在保障ROI區部分圖像質量的前提下,其他部分可以進行更高的壓縮。這樣在大大壓縮數據量的同時,仍有滿意的圖像恢復質量。這就是感興趣區優先編碼策略。

3 視頻編碼實時性研究

由於視頻數據的特殊性,視頻傳輸系統對實時性要求很高。這里重點介紹基於視頻編碼協議演算法的實時性問題。小波編碼等演算法雖然有許多優點,但是演算法復雜度太高,目前難於達到實時性要求。下面介紹基於協議編碼演算法中的幾個重要環節,它們對提高視頻編碼系統實時性有重要作用。

3.1 運動估計

預測編碼可以有效去除時間域上的冗餘信息,運動估計則是預測編碼的重要環節。運動估計是要在參考幀中找到一個和當前幀圖像塊最相似的圖像塊,即最佳匹配塊。估計結果用運動向量來表示。研究運動估計演算法就是要研究匹配塊搜索演算法。

研究分析表示,原始運動估計演算法在編碼器運行中消耗了編碼器70%左右的執行時間。因此,為了提高編碼器執行速度必須首先提高運動估計演算法的效率。

窮盡搜索法是最原始的運動估計演算法,它能得到全局最優結果,但是由於運算量大,不宜在實現應用中使用。快速運動估計演算法通過減小搜索空間,加快了搜索過程。雖然快速運動估計演算法得到的運動向量沒有窮盡搜索法的結果那樣精確,但是由於它可以顯著減少運算時間,精度也能滿足很多應用的需要,因而它們的應用十分廣泛。典型的快速搜索演算法有:共軛方向搜索法(CDS)、二維對數法(TDL)、三步搜索法(TSS)、交叉搜索法(CSA)等。

3.2 演算法結構的並行化

並行化處理的體系結構十分有利於提高系統處理能力,加之視頻編碼演算法有很強的並行處理潛力,因此,人們研究了編碼演算法的並行運算能力,進一步保障了編碼演算法的實時實現。

例如,如果有兩個並行處理器,依可以同時進行兩個圖像塊的運行估計或者DCT變換,這樣依把運動估計和DCT變換環節的運算時間縮短了一倍。

3.3 高速DSP晶元和專用DSP設計

微電子技術的發展,也使近年來DSP晶元有了很大的進步。每秒幾十或上百BOPS次的運算速度(1個BOPS為每秒10億次)DSP晶元已經出現,這為系統實時處理提高了硬體保證。

通用高速DSP晶元在視頻編碼演算法的研究開發中扮演了重要角色。許多DSP生產廠商甚至提供實現某種編碼協議的專用晶元。

4 碼率控制研究

編碼策略是編碼器中重要環節。碼率控制技術是視頻通信應用中的關鍵技術之一,它負責編碼器各個環節與傳輸信道和解碼器之間的協調,在編碼器中具有重要地位。因為碼率控制策略需要由具體應用場合決定,所以象H.263+、MPEG-4等視頻編碼協議,都沒有規定具體碼率控制方法。

由於視頻碼流結構具有分層的特點,因而碼率控制方案的研究一般分成了兩個層交人,圖像層碼率控制、宏塊層碼率控制。圖像層碼率控制的主要任務是,根據系統對編碼器輸出碼率的期望、系統傳輸延遲的限制、傳送緩沖區的滿溢程度等同,在一幀圖像編碼前,確定該幀圖像的輸出期望比特數。宏塊層碼率控制的主要任務是,根據圖像層碼率控制確定的該幀圖像的輸出期望比特數,給圖像各部分選擇合適的量化步長。宏塊層碼率控制的主要依據是率失真(Rate-Distortion)模型。

TMN8碼率控制方案,是迄今為止一套優秀的碼率控制方案。它被H.263+的TMN8模型的MPEG-4(Version 1)的VM8模型所採納。該方案的精化部分在於宏塊層碼率控制部分,它採用了一種十分有效的率失真模型,是宏塊層碼率控制的誤差很小;在圖像層碼率控制方面,該方案的前提較為簡單,主要考慮了編碼時延、緩沖區滿溢程度等因素,並且要求編碼器的工作幀頻恆定。

在很多情況下,視頻編碼的幀頻不可能保持恆定,或者不「應該」恆定。考慮到視頻編碼器工作點的變化,以及現有率失真模型可能存在的誤差,人們將現代控制理論引入到圖碼率控制中,設計了更穩定的碼率控制方案。

由於宏塊層碼率控制環節直接決定圖像各宏塊使用的量化步長,因此利用宏塊層友率控制方法,可以輕易實現圖像感興趣區優先編碼策略。使用感興趣區優先編碼策略時,雖然對整幅圖像而言仍屬低碼率編碼范疇,但對於感興趣區域而言卻存在局部高碼率編碼。現有低碼率控制演算法,包括TMN8方案,都沒有考慮到這一現象。它們將整幅圖像所有部分都作為低碼率編碼對象,並以此建立碼率控制模型。因此這些碼率控制方案直接與感興趣區優先編碼策略相結合時,會導致不應有的碼率控制誤差。為此,人們又提出了一套用不動聲色低碼率應用的碼率控制框架,它適應了感興趣區優先編碼策略的需要。

5 魯棒性研究

無線信道干擾因素多,誤碼率高,因此無線視頻的魯棒傳輸研究對於無線視頻傳輸的實用化十分重要。

5.1 魯棒的壓縮編碼

視頻壓縮編碼的最後一個環節是熵編碼。熵編碼的特點決定了視頻碼流對誤比特高度敏感。於是,人們設計了多種技術用於在視頻編碼環節進行差錯復原,提高碼流魯棒性。MPEG-4中定義的主要差錯控制技術有:重同步(Resynchronization)、數據分割(Data Partition)、可逆變長編碼(RVLC)。H.263+中用於差錯復原的技術主要包括前向糾錯編碼(FEC)、條帶模式(Slice Mode)、獨立分段解碼(Independent Segment Decoding)和參考圖像選擇(Reference Picture Selection)等。H.263++則又增加了數據分割的條帶模式,並對參考圖像選擇模式進行了修改。

此外,在信源解碼端,人們又設計了數據恢復(Data Recovery)和差錯掩蓋(Error Concealment)等技術,以便盡量減少碼流中錯誤比特的負面影響。

5.2 魯棒的復用環節

多媒體通信中,復用是緊隨編碼環節的一個環節。以ITU定義的H.324標准為例,該標准由若干協議組成,包括音頻編碼協議G.723、視頻編碼協議H.26X、控制協議H.245和復用協議H.223。H.223是一個面向連接的復用器,負責把多媒體終端的多個數據源(音頻、視頻、數據等)復合為一個碼流。Villasenor等已經注意到復用器出現的差錯對視頻可能產生的影響,但沒有特點深入的研究成果。

5.3 魯棒的信道編碼環節

信道編碼也稱差錯控制編碼。與信源編碼的目的不同,信源編碼是盡量壓縮數據,用盡量少的比特描述原始視頻圖像;信道編碼是利用附加比特來保障原始比特能正確無誤地到達目的地。信道傳輸中的糾錯方法包括:前向誤碼糾錯(FEC)、自動重發(ARQ)和混合糾錯(HEC)。

Shannon從理論上給出了信道傳輸能力的上限。信道編碼方法的研究設計目標有二,一是盡量利用信道容量,二是抗干擾性能更強。

Turbo碼是近年來紀錯編碼領域的活躍分支,由法國學者C.Berrou等人在1993年看出的,其模擬性能紀錯能力。但是Turbo碼的解碼演算法十分復雜,關於Turbo碼解碼的實時實現是當前研究熱點之一。

5.4 信源信道組合編碼

不同的信道編碼策略對信元的保護能力也不同。根據信元的重要程度,合理地予以差錯控制編碼,將有效地提高傳輸系統的效率。這是不平等的保護策略(Unequal Error Protection)。信元的重要程度,可以有多種劃分方法,如按照信元對解碼所起作用,或者按照信元對人眼感知所起作用,等等。

還有許多學者研究了信道模型在信源信道組合編碼中的應用。三種典型無線信道模型是二進制對稱雜訊通道(Binary Symmetric Channels)、加性白高斯雜訊通道(Additie White Gaussian Channels)、G-E突發雜訊通道(Gilbert-Elliott Bursty Channels)。Chang Wen Chen等在研究這些信道模型的基礎上,研究了新的率失真模型,該模型不僅描述了量化引入的誤差,而且將信道雜訊考慮在內。在一定的信道傳輸速率要求下,利用這樣的率失真模型,不僅可以在子信源之間合理分配比特,而且可以更好地平衡信源編碼精度與信道編碼保護兩者對碼率的需要。

6 無線視頻傳輸系統的優化與管理

在前面幾部分的研究中,主要目標是解決無線視頻傳輸的基礎問題:視頻數據的壓縮問題、編碼的實時實現、視頻碼流的魯棒傳輸。事實上,除了上述問題,還有許多與無線視頻傳輸密切相關的領域,它們對無線視頻傳輸的實現、推廣有著舉足輕重的影響。

6.1 通信協議的研究

中國公眾多媒體通信網是一個基於IP協議的通信網,它的通信協議是基於TCP/IP的。當然,IP協議和TCP協議僅是核心協議。為保證實時視頻通信業務能很好地運行,需要使用實時傳送協議(RTP)和實時傳送控制協議(RTCP)。為了給實時業務或其它特定業務的傳送留有足夠寬的通道,還必須使用資源預留協議(RSVP)。上述五個通信協議是IP網的主要通信協議。

Ipv6作Internet Protocol的新版本,將繼承和取代傳統IP(Ipv4)。從Ipv4到Ipv6的改變將為下一代網際網路奠定更堅實的基礎,如,Ipv6力求使網路管理變得更加簡單,考慮到不同用戶對服務質量的不同需要,其中若干技術十分有利於實時多媒體業務的實理。

6.2 接入控制(Admissior Control)

類似有線網路,無線網路要決定是否允許新連接接入;此外無線網路還要決定是否允許切換連接,並要在二者之間謀求最優解決方案。

Naghshineh在1996年提出虛擬連接樹的新概念,設計了基於虛擬連接樹的高速移動ATM網路體系,並研究了在該體系結構下的接入控制方案。簡單說,作者用一個虛擬樹來描述位於一定距離內小區的移動用戶。一旦移動用戶的呼叫被允許,他依可以在虛擬樹內的所有小區間自由切換,而無須重新請求。

在高速無線多媒體網路中,Oliveira等則提出了基於帶寬預留的接入控制方案,即在建立呼叫小區附近入的小區中,進行帶寬預留,以保障服務質量。當用戶進入一個新的小區,被預留的帶寬將被利用。

6.3 資源預留(Resource Reservation)

對於視頻、話音等實時業務,為保證可接受的服務質量,應該保留一定的連接帶寬。此外,與新呼叫相比,切換呼叫應有更高的優先權。

6.4 Qos業務模型(Qos Service Model)

無線多媒體Qos支持的基本目標是,在帶寬有限情況下,提供和用戶支付費用相當的服務質量。建立合適的業務模型是首先要解決的問題。所謂業務模型,就是要根據各種具體應用的特點,將其劃分成不同類型。例如,在支持Qos和ATM中定義了幾種業務模型:恆定比特率(CBR)業務、實時可變比特率(rt-VBR)業務、非實時可變比特率(nrt-VBR)業務、可用比特率(ABR)業務和不定比特率(UBR)業務。恆定比特率業務對帶寬的要求最為嚴格,其他類型對帶寬的要求依次放鬆。

現有的大理多媒體業務是在基於IP的網路上開展的,而rc設計IP協議的初衷是傳輸數據的,是一種「盡力而為」的網路,並不支持Qos。為此,其上的實時業務模型被分為兩類:有保障業務(Guaranteed Service)和無保障業務(Predictive Service)。

總之,在無線多媒體環境下,建立起合理的業務模型對保障Qos至關重要。在這一領域,人們始終在做出努力。如,較早時候,Oliverira等只用實時業務與非實時業務加以區分;1999年,Talukder等提出三類業務模型;2000年,Lei Huang等不僅考慮帶寬和延遲需要,還考慮了移動用戶的運動特性,提出多達七類業務模型。

6.5 圖像質量評價准則

恰當的圖像質量評價方法是無線多媒體通信的基本需要。由於無線環境帶寬有限,不可能為所有用戶都提供相同質量的服務,所以只能提供和用戶支付費用相當的服務質量。因此必須有一套能准確反映用戶接受服務的客觀質量標准。

除了些特殊場合,純粹額觀評價(如基於均方誤差的評價方法)已經被普遍認為不是真正「客觀」的圖像質量評價,越來越多的人認為,人眼視覺系統(HVS)的特性應該考慮在內。

Westen等人在1995年提出了基於多通道的HVS模型,用來評價圖像的感受質量。宋堅信等人最近又提出一種壓縮視頻感覺質量的計算方法,其核心思想是,利用視覺掩蔽特性, 分析與壓縮視頻質量有關的視覺特性及視頻圖像內容特性,提出視覺掩蔽計算結構及用模糊學方法進行視覺閾值提升的計算方法。

總之,面向惡劣無線環境的數字視頻傳輸技術尚未成熟;面向大眾應用的無線視頻傳輸技術元未成熟。因此,現在加強在該領域的研究力度,是增強我國科技實力的一次機遇,對於我國在未來通信領域占據一席之地將起重要作用。

❺ 如何成為一名優秀的演算法工程師

演算法工程師是一個非常高端的職位;
專業要求:計算機、電子、通信、數學等相關專業;
學歷要求:本科及其以上的學歷,大多數是碩士學歷及其以上;
語言要求:英語要求是熟練,基本上能閱讀國外專業書刊;
必須掌握計算機相關知識,熟練使用模擬工具MATLAB等,必須會一門編程語言。
簡介:
演算法工程師根據研究領域來分主要有音頻/視頻演算法處理、圖像技術方面的二維信息演算法處理和通信物理層、雷達信號處理、生物醫學信號處理等領域的一維信息演算法處理。
在計算機音視頻和圖形圖形圖像技術等二維信息演算法處理方面目前比較先進的視頻處理演算法:機器視覺成為此類演算法研究的核心;另外還有2D轉3D演算法(2D-to-3D conversion),去隔行演算法(de-interlacing),運動估計運動補償演算法(Motion estimation/Motion Compensation),去噪演算法(Noise Rection),縮放演算法(scaling),銳化處理演算法(Sharpness),超解析度演算法(Super Resolution),手勢識別(gesture recognition),人臉識別(face recognition)。
在通信物理層等一維信息領域目前常用的演算法:無線領域的RRM、RTT,傳送領域的調制解調、信道均衡、信號檢測、網路優化、信號分解等。
另外數據挖掘、互聯網搜索演算法也成為當今的熱門方向。
演算法工程師逐漸往人工智慧方向發展。

❻ 成為演算法工程師需要學習哪些課程

演算法工程師要求很高的數學水平和邏輯思維。需要學習高數,線性代數,離散數學,數據結構和計算機等課程。

專業要求:計算機、電子、通信、數學等相關專業;

學歷要求:本科及其以上的學歷,大多數是碩士學歷及其以上;

語言要求:英語要求是熟練,基本上能閱讀國外專業書刊;

必須掌握計算機相關知識,熟練使用模擬工具MATLAB等,必須會一門編程語言。

國內外狀況

國內從事演算法研究的工程師不少,但是高級演算法工程師卻很少,是一個非常緊缺的專業工程師。

演算法工程師根據研究領域來分主要有音頻/視頻演算法處理、圖像技術方面的二維信息演算法處理和通信物理層、雷達信號處理、生物醫學信號處理等領域的一維信息演算法處理。

❼ MP4到底是代表哪幾種視頻格式呀!真是急死了,沒有人能說清楚嗎謝謝!

自己找找相關的基礎文章看看吧,沒什麼好急的,學知識要主動才行。mpeg4壓縮方案包含很多種編碼方式的。

MPEG全稱是Moving Pictures Experts Group,它是「動態圖象專家組」的英文縮寫,該專家組成立於1988年,致力於運動圖像及其伴音的壓縮編碼標准化工作,原先他們打算開發MPEG1、MPEG2、MPEG3和MPEG4四個版本,以適用於不同帶寬和數字影像質量的要求。
目前,MPEG1技術被廣泛的應用於VCD,而MPEG2標准則用於廣播電視和DVD等。MPEG3最初是為HDTV開發的編碼和壓縮標准,但由於MPEG2的出色性能表現, MPEG3隻能是死於襁褓了。而我們今天要談論的主角——MPEG4於1999年初正式成為國際標准。它是一個適用於低傳輸速率應用的方案。與MPEG1和MPEG2相比,MPEG4更加註重多媒體系統的交互性和靈活性。下面就讓我們一起進入多彩的MPEG4世界。

MPEG4的技術特點

MPEG1、MPEG2技術當初制定時,它們定位的標准均為高層媒體表示與結構,但隨著計算機軟體及網路技術的快速發展,MPEG1.MPEG2技術的弊端就顯示出來了:交互性及靈活性較低,壓縮的多媒體文件體積過於龐大,難以實現網路的實時傳播。而MPEG4技術的標準是對運動圖像中的內容進行編碼,其具體的編碼對象就是圖像中的音頻和視頻,術語稱為「AV對象」,而連續的AV對象組合在一起又可以形成AV場景。因此,MPEG4標准就是圍繞著AV對象的編碼、存儲、傳輸和組合而制定的,高效率地編碼、組織、存儲、傳輸AV對象是MPEG4標準的基本內容。
在視頻編碼方面,MPEG4支持對自然和合成的視覺對象的編碼。(合成的視覺對象包括2D、3D動畫和人面部表情動畫等)。在音頻編碼上,MPEG4可以在一組編碼工具支持下,對語音、音樂等自然聲音對象和具有回響、空間方位感的合成聲音對象進行音頻編碼。
由於MPEG4隻處理圖像幀與幀之間有差異的元素,而舍棄相同的元素,因此大大減少了合成多媒體文件的體積。應用MPEG4技術的影音文件最顯著特點就是壓縮率高且成像清晰,一般來說,一小時的影像可以被壓縮為350M左右的數據,而一部高清晰度的DVD電影, 可以壓縮成兩張甚至一張650M CD光碟來存儲。對廣大的「平民」計算機用戶來說, 這就意味著, 您不需要購置 DVD-ROM就可以欣賞近似DVD質量的高品質影像。而且採用MPEG4編碼技術的影片,對機器硬體配置的要求非常之低,300MHZ 以上CPU,64M的內存和一個 8M顯存的顯卡就可以流暢的播放。在播放軟體方面,它要求也非常寬松,你只需要安裝一個 500K左右的 MPEG4 編碼驅動後,用 WINDOWS 自帶的媒體播放器就可以流暢的播放了(下面我們會具體講到)。

視頻編碼研究與MPEG標准演進

人類獲取的信息中70%來自於視覺,視頻信息在多媒體信息中佔有重要地位;同時視頻數據冗餘度最大,經壓縮處理後的視頻質量高低是決定多媒體服務質量的關鍵因素。因此數字視頻技術是多媒體應用的核心技術,對視頻編碼的研究已成為信息技術領域的熱門話題。

視頻編碼的研究課題主要有數據壓縮比、壓縮/解壓速度及快速實現演算法三方面內容。以壓縮/解壓後數據與壓縮前原始數據是否完全一致作為衡量標准,可將數據壓縮劃分為無失真壓縮(即可逆壓縮)和有失真壓縮(即不可逆壓縮)兩類。

傳統壓縮編碼建立在仙農資訊理論基礎之上的,以經典集合論為工具,用概率統計模型來描述信源,其壓縮思想基於數據統計,因此只能去除數據冗餘,屬於低層壓縮編碼的范疇。

伴隨著視頻編碼相關學科及新興學科的迅速發展,新一代數據壓縮技術不斷誕生並日益成熟,其編碼思想由基於像素和像素塊轉變為基於內容 (content-based)。它突破了仙農資訊理論框架的束縛,充分考慮了人眼視覺特性及信源特性,通過去除內容冗餘來實現數據壓縮,可分為基於對象(object-based)和基於語義(semantics-based)兩種,前者屬於中層壓縮編碼,後者屬於高層壓縮編碼。

與此同時,視頻編碼相關標準的制定也日臻完善。視頻編碼標准主要由ITU-T和ISO/IEC開發。ITU-T發布的視頻標准有H.261、 H.262、 H.263、 H.263+、H.263++,ISO/IEC公布的MPEG系列標准有MPEG-1、MPEG-2 、MPEG-4 和MPEG-7,並且計劃公布MPEG-21。

MPEG即Moving Picture Expert Group(運動圖像專家組),它是專門從事制定多媒體視音頻壓縮編碼標準的國際組織。MPEG系列標准已成為國際上影響最大的多媒體技術標准,其中MPEG-1和MPEG-2是採用以仙農資訊理論為基礎的預測編碼、變換編碼、熵編碼及運動補償等第一代數據壓縮編碼技術;MPEG-4(ISO/IEC 14496)則是基於第二代壓縮編碼技術制定的國際標准,它以視聽媒體對象為基本單元,採用基於內容的壓縮編碼,以實現數字視音頻、圖形合成應用及互動式多媒體的集成。MPEG系列標准對VCD、DVD等視聽消費電子及數字電視和高清晰度電視(DTV&&HDTV)、多媒體通信等信息產業的發展產生了巨大而深遠的影響。

MPEG-4視頻編碼核心思想及關鍵技術

核心思想

在MPEG-4制定之前,MPEG-1、MPEG-2、H.261、H.263都是採用第一代壓縮編碼技術,著眼於圖像信號的統計特性來設計編碼器,屬於波形編碼的范疇。第一代壓縮編碼方案把視頻序列按時間先後分為一系列幀,每一幀圖像又分成宏塊以進行運動補償和編碼,這種編碼方案存在以下缺陷:

· 將圖像固定地分成相同大小的塊,在高壓縮比的情況下會出現嚴重的塊效應,即馬賽克效應;
· 不能對圖像內容進行訪問、編輯和回放等*作;
· 未充分利用人類視覺系統(HVS,Human Visual System)的特性。

MPEG-4則代表了基於模型/對象的第二代壓縮編碼技術,它充分利用了人眼視覺特性,抓住了圖像信息傳輸的本質,從輪廓、紋理思路出發,支持基於視覺內容的交互功能,這適應了多媒體信息的應用由播放型轉向基於內容的訪問、檢索及*作的發展趨勢。

AV對象(AVO,Audio Visual Object)是MPEG-4為支持基於內容編碼而提出的重要概念。對象是指在一個場景中能夠訪問和*縱的實體,對象的劃分可根據其獨特的紋理、運動、形狀、模型和高層語義為依據。在MPEG-4中所見的視音頻已不再是過去MPEG-1、MPEG-2中圖像幀的概念,而是一個個視聽場景(AV場景),這些不同的AV場景由不同的AV對象組成。AV對象是聽覺、視覺、或者視聽內容的表示單元,其基本單位是原始AV對象,它可以是自然的或合成的聲音、圖像。原始AV對象具有高效編碼、高效存儲與傳輸以及可交互*作的特性,它又可進一步組成復合AV對象。因此MPEG-4標準的基本內容就是對AV對象進行高效編碼、組織、存儲與傳輸。AV對象的提出,使多媒體通信具有高度交互及高效編碼的能力,AV對象編碼就是MPEG-4的核心編碼技術。

MPEG-4不僅可提供高壓縮率,同時也可實現更好的多媒體內容互動性及全方位的存取性,它採用開放的編碼系統,可隨時加入新的編碼演算法模塊,同時也可根據不同應用需求現場配置解碼器,以支持多種多媒體應用。

MPEG-4 採用了新一代視頻編碼技術,它在視頻編碼發展史上第一次把編碼對象從圖像幀拓展到具有實際意義的任意形狀視頻對象,從而實現了從基於像素的傳統編碼向基於對象和內容的現代編碼的轉變,因而引領著新一代智能圖像編碼的發展潮流。

關鍵技術

MPEG-4除採用第一代視頻編碼的核心技術,如變換編碼、運動估計與運動補償、量化、熵編碼外,還提出了一些新的有創見性的關鍵技術,並在第一代視頻編碼技術基礎上進行了卓有成效的完善和改進。下面重點介紹其中的一些關鍵技術。

A. 視頻對象提取技術

MPEG-4實現基於內容交互的首要任務就是把視頻/圖像分割成不同對象或者把運動對象從背景中分離出來,然後針對不同對象採用相應編碼方法,以實現高效壓縮。因此視頻對象提取即視頻對象分割,是MPEG-4視頻編碼的關鍵技術,也是新一代視頻編碼的研究熱點和難點。

視頻對象分割涉及對視頻內容的分析和理解,這與人工智慧、圖像理解、模式識別和神經網路等學科有密切聯系。目前人工智慧的發展還不夠完善,計算機還不具有觀察、識別、理解圖像的能力;同時關於計算機視覺的研究也表明要實現正確的圖像分割需要在更高層次上對視頻內容進行理解。因此,盡管MPEG-4 框架已經制定,但至今仍沒有通用的有效方法去根本解決視頻對象分割問題,視頻對象分割被認為是一個具有挑戰性的難題,基於語義的分割則更加困難。

目前進行視頻對象分割的一般步驟是:先對原始視頻/圖像數據進行簡化以利於分割,這可通過低通濾波、中值濾波、形態濾波來完成;然後對視頻/圖像數據進行特徵提取,可以是顏色、紋理、運動、幀差、位移幀差乃至語義等特徵;再基於某種均勻性標准來確定分割決策,根據所提取特徵將視頻數據歸類;最後是進行相關後處理,以實現濾除雜訊及准確提取邊界。

在視頻分割中基於數學形態理論的分水嶺(watershed)演算法被廣泛使用,它又稱水線演算法,其基本過程是連續腐蝕二值圖像,由圖像簡化、標記提取、決策、後處理四個階段構成。分水嶺演算法具有運算簡單、性能優良,能夠較好提取運動對象輪廓、准確得到運動物體邊緣的優點。但分割時需要梯度信息,對雜訊較敏感,且未利用幀間信息,通常會產生圖像過度分割。

B. VOP視頻編碼技術

視頻對象平面(VOP,Video Object Plane)是視頻對象(VO)在某一時刻的采樣,VOP是MPEG-4視頻編碼的核心概念。MPEG-4在編碼過程中針對不同VO採用不同的編碼策略,即對前景VO的壓縮編碼盡可能保留細節和平滑;對背景VO則採用高壓縮率的編碼策略,甚至不予傳輸而在解碼端由其他背景拼接而成。這種基於對象的視頻編碼不僅克服了第一代視頻編碼中高壓縮率編碼所產生的方塊效應,而且使用戶可與場景交互,從而既提高了壓縮比,又實現了基於內容的交互,為視頻編碼提供了廣闊的發展空間。

MPEG-4支持任意形狀圖像與視頻的編解碼。對於任意形狀視頻對象。對於極低比特率實時應用,如可視電話、會議電視,MPEG-4則採用VLBV(Very Low Bit-rate Video,極低比特率視頻)核進行編碼。

傳統的矩形圖在MPEG-4中被看作是VO的一種特例,這正體現了傳統編碼與基於內容編碼在MPEG-4中的統一。VO概念的引入,更加符合人腦對視覺信息的處理方式,並使視頻信號的處理方式從數字化進展到智能化,從而提高了視頻信號的交互性和靈活性,使得更廣泛的視頻應用及更多的內容交互成為可能。因此VOP視頻編碼技術被譽為視頻信號處理技術從數字化進入智能化的初步探索。

C. 視頻編碼可分級性技術

隨著網際網路業務的巨大增長,在速率起伏很大的IP(Internet Protocol)網路及具有不同傳輸特性的異構網路上進行視頻傳輸的要求和應用越來越多。在這種背景下,視頻分級編碼的重要性日益突出,其應用非常廣泛,且具有很高的理論研究及實際應用價值,因此受到人們的極大關注。

視頻編碼的可分級性(scalability)是指碼率的可調整性,即視頻數據只壓縮一次,卻能以多個幀率、空間解析度或視頻質量進行解碼,從而可支持多種類型用戶的各種不同應用要求。

MPEG-4通過視頻對象層(VOL,Video Object Layer)數據結構來實現分級編碼。MPEG-4提供了兩種基本分級工具,即時域分級(Temporal Scalability)和空域分級(Spatial Scalability),此外還支持時域和空域的混合分級。每一種分級編碼都至少有兩層VOL,低層稱為基本層,高層稱為增強層。基本層提供了視頻序列的基本信息,增強層提供了視頻序列更高的解析度和細節。

在隨後增補的視頻流應用框架中,MPEG-4提出了FGS(Fine Granularity Scalable,精細可伸縮性)視頻編碼演算法以及PFGS(Progressive Fine Granularity Scalable,漸進精細可伸縮性)視頻編碼演算法。

FGS編碼實現簡單,可在編碼速率、顯示解析度、內容、解碼復雜度等方面提供靈活的自適應和可擴展性,且具有很強的帶寬自適應能力和抗誤碼性能。但還存在編碼效率低於非可擴展編碼及接收端視頻質量非最優兩個不足。

PFGS則是為改善FGS編碼效率而提出的視頻編碼演算法,其基本思想是在增強層圖像編碼時使用前一幀重建的某個增強層圖像為參考進行運動補償,以使運動補償更加有效,從而提高編碼效率。

D. 運動估計與運動補償技術

MPEG-4採用I-VOP、P-VOP、B-VOP三種幀格式來表徵不同的運動補償類型。它採用了H.263中的半像素搜索(half pixel searching)技術和重疊運動補償(overlapped motion compensation)技術,同時又引入重復填充(repetitive padding)技術和修改的塊(多邊形)匹配(modified block (polygon)matching)技術以支持任意形狀的VOP區域。

此外,為提高運動估計演算法精度,MPEG-4採用了MVFAST(Motion Vector Field Adaptive Search Technique)和改進的PMVFAST(Predictive MVFAST)方法用於運動估計。對於全局運動估計,則採用了基於特徵的快速頑健的FFRGMET(Feature-based Fast and Robust Global Motion Estimation Technique)方法。

在MPEG-4視頻編碼中,運動估計相當耗時,對編碼的實時性影響很大。因此這里特別強調快速演算法。運動估計方法主要有像素遞歸法和塊匹配法兩大類,前者復雜度很高,實際中應用較少,後者則在H.263和MPEG中廣泛採用。在塊匹配法中,重點研究塊匹配准則及搜索方法。目前有三種常用的匹配准則:

(1)絕對誤差和(SAD, Sum of Absolute Difference)准則;
(2)均方誤差(MSE, Mean Square Error)准則;
(3)歸一化互相關函數(NCCF, Normalized Cross Correlation Function)准則。

在上述三種准則中,SAD准則具有不需乘法運算、實現簡單方便的優點而使用最多,但應清楚匹配准則的選用對匹配結果影響不大。

在選取匹配准則後就應進行尋找最優匹配點的搜索工作。最簡單、最可靠的方法是全搜索法(FS, Full Search),但計算量太大,不便於實時實現。因此快速搜索法應運而生,主要有交叉搜索法、二維對數法和鑽石搜索法,其中鑽石搜索法被MPEG-4校驗模型(VM, Verification Model)所採納,下面詳細介紹。

鑽石搜索(DS, Diamond Search)法以搜索模板形狀而得名,具有簡單、魯棒、高效的特點,是現有性能最優的快速搜索演算法之一。其基本思想是利用搜索模板的形狀和大小對運動估計演算法速度及精度產生重要影響的特性。在搜索最優匹配點時,選擇小的搜索模板可能會陷入局部最優,選擇大的搜索模板則可能無法找到最優點。因此DS演算法針對視頻圖像中運動矢量的基本規律,選用了兩種形狀大小的搜索模板。

· 大鑽石搜索模板(LDSP, Large Diamond Search Pattern),包含9個候選位置;
· 小鑽石搜索模板(SDSP, Small Diamond Search Pattern),包含5個候選位置。

DS演算法搜索過程如下:開始階段先重復使用大鑽石搜索模板,直到最佳匹配塊落在大鑽石中心。由於LDSP步長大,因而搜索范圍廣,可實現粗定位,使搜索不會陷於局部最小,當粗定位結束後,可認為最優點就在LDSP 周圍8 個點所圍菱形區域中。然後再使用小鑽石搜索模板來實現最佳匹配塊的准確定位,以不產生較大起伏,從而提高運動估計精度。

此外Sprite視頻編碼技術也在MPEG-4中應用廣泛,作為其核心技術之一。Sprite又稱鑲嵌圖或背景全景圖,是指一個視頻對象在視頻序列中所有出現部分經拼接而成的一幅圖像。利用Sprite可以直接重構該視頻對象或對其進行預測補償編碼。

Sprite視頻編碼可視為一種更為先進的運動估計和補償技術,它能夠克服基於固定分塊的傳統運動估計和補償技術的不足,MPEG-4正是採用了將傳統分塊編碼技術與Sprite編碼技術相結合的策略。

MPEG4的應用領域

憑借著出色的性能,MPEG4技術目前在多媒體傳輸、多媒體存儲等領域得到了廣泛的應用,下面我們就來看看目前在那些領域MPEG4技術得到了大顯伸手的機會。
1、精彩的視頻世界
精彩的視頻世界是MPEG4技術應用最多也是最為廣大朋友所熟悉的的形式。目前它主要以兩種形式出現,一種是DIVX-MPEG4影碟(國內市面上已出現,且D版居多),另一種是網上MPEG4電影。
(1)、我們先來說說DIVX-MPEG4影碟,DIVX視頻編碼技術實際上就是MPEG4壓縮技術,它由微軟MPEG4V3修改而來,使用的是MPEG4壓縮演算法,並同時分離視頻和音頻。它的核心部分便是由DivX對DVD音視頻進行壓縮,生成Mpeg4視頻格式文件(也就是AVI格式)。
小提示:筆者也是經常被朋友所問到:「我看到的MPEG4電影片段明明是avi(擴展名)格式文件,並且Windows的媒體播放器也與之關聯,但就是無法播放」。其實, MPEG4並沒有確定必須用什麼擴展名,它只是一種編碼方法而已。使用avi作為擴展名,是一種習慣性的沿用。
在計算機上播放MPEG4影音文件的方法目前有兩種:第一種是用諸如DivxPlayer等專門的播放軟體來播放;第二種播放方法是安裝MPEG4(Divx)插件後,用Windows自帶的媒體播放機來播放。
(2)、隨著網路技術的不斷發展,互聯網上的視頻流應用也成為了近幾年的熱門話題。目前,在互聯網上比較流行的幾種影像格式包括Quicktime、RealPlay以及微軟的MediaPlayer等。MPEG4技術出現之後,互聯網上又出現了MPEG4格式的電影,不過在觀看前,系統會提示你下載最新的MPEG4解碼軟體。
小提示:大家平時在網上可能經常會看見ASF格式的電影,其實它也是微軟公司開發出的一種可以直接在網上觀看視頻節目的壓縮格式。使用的也是MPEG4的壓縮演算法,但因為它是以網上即時觀看電影的視頻流格式存在的,所以它的圖像質量相對要差一些。
2、低比特率下的多媒體通信,
目前,MPEG4技術已經廣泛的應用在如視頻電話、視頻電子郵件、移動通信、電子新聞等多媒體通信領域。由於這些應用對傳輸速率要求較低,一般在4.8~64kbit/s之間,解析度為176×144左右。因此MPEG4技術完全可以充分的利用網路帶寬,通過幀重建技術壓縮和傳輸數據,以最少的數據量獲得最佳的圖像質量。
3、實時多媒體監控。
多媒體監控領域原來一直是MPEG1技術擔當重任,但近些年來,它們也是「城頭變換大王旗」了。由於MPEG4壓縮技術原本是一種適用在低帶寬下進行信息交換的音視頻處理技術,它的特點是可以動態的偵測圖像各個區域變化,基於對象的調整壓縮方法可以獲得比MPEG1更大的壓縮比,使壓縮碼流更低。因此,盡管MPEG4技術一開始並不是專為視頻監控壓縮領域而開發的,但它高清晰度的視頻壓縮,在實時多媒體監控上,無能是存儲量,傳輸的速率,清晰度都比MPEG1具有更大的優勢。
4、基於內容存儲和檢索的多媒體系統。
由於MPEG4在壓縮方法上遠遠優於MPEG1技術,更是MJPEG技術所不能比擬的。 經過專家的測試表明,在相同清晰度對應MPEG1(500Kbits/sec)碼流情況下, MPEG4比MPEG1節省了2/3的硬碟空間,在一般活動場景下也節省近一般的容量。因此無論是從內容存儲量,還是從多媒體文件的檢索速度來說,MPEG4技術都是多媒體系統應用的不二之選。
5、硬體產品上面的應用
目前,MPEG4技術在硬體產品上也已開始逐步得到應用。特別是在視頻監控、播放上,這項高清晰度,高壓縮的技術得到了眾多硬體廠商的鍾愛,而市場上支持MPEG4技術的產品也是種類繁多。下面筆者就列舉一些代表性的產品,旨在讓讀者了解MPEG4技術在今天應用范圍之廣。
(1)、攝像機:日本夏普公司推出過應用在互聯網上的數字攝像機VN-EZ1。這台網路攝像機利用MPEG4格式,可把影像文件壓縮為ASF(高級流格式),用戶只要利用微軟公司的MediaPlayer播放程序,就可以直接在電腦上進行播放。
(2)、播放機:飛利浦公司於今年八月份推出了一款支持DivX的DVD播放機DVD737。它可以支持DivX 3.11、4.xx、5.xx等MPEG4標准,而對於新標準的支持則可以通過升級固件來實現。
(3)、數碼相機:日本京瓷公司在11月中旬發售其最新款數碼相機Finecam L30,這款是採用300萬像素、3倍光學變焦設計的數碼相機產品, L30採用了MPEG4格式動態視頻錄制,可以讓動態視頻錄制畫面效果比傳統數碼相機更出色。
(4)、手機:在手機領域,MPEG4技術更是得到了廣泛的應用,各大手機廠商也都推出了可拍攝MPEG4動態視頻的手機型號,如西門子ST55、索尼愛立信P900/P908、LG 彩屏G8000等。
(5)、MPEG4數字硬碟:在今年深圳舉行的安防展覽會上,開發數字錄像監控產品的廠家紛紛推出了他們的最新產品,而支持MPEG4的DVR壓縮技術也成為改展會上的亮點。
如北京華青紫博科技推出的「E眼神MPEG4數字視頻王」便是一款基於網路環境的高清晰數字化監控報警系統。內置多畫面處理器,集現場監控、監聽、多路同時數字錄像與回放等多種功能為一體。
其實,市場上還有許多基於MPEG4技術的硬體產品,筆者這里就不一一列舉了,不過筆者相信,隨著視頻壓縮技術的不斷發展,MPEG4技術的產品會越來越多的出現在我們生活,工作中。

❽ 演算法工程師要學什麼

演算法工程師要求很高的數學水平和邏輯思維。需要學習高數,線性代數,離散數學,數據結構和計算機等課程。

1、專業要求:計算機、電子、通信、數學等相關專業;

2、學歷要求:本科及其以上的學歷,大多數是碩士學歷及其以上;

3、語言要求:英語要求是熟練,基本上能閱讀國外專業書刊;

必須掌握計算機相關知識,熟練使用模擬工具MATLAB等,必須會一門編程語言。

演算法工程師根據研究領域來分主要有音頻/視頻演算法處理、圖像技術方面的二維信息演算法處理和通信物理層、雷達信號處理、生物醫學信號處理等領域的一維信息演算法處理。

在計算機音視頻和圖形圖形圖像技術等二維信息演算法處理方面目前比較先進的視頻處理演算法:機器視覺成為此類演算法研究的核心;

另外還有2D轉3D演算法(2D-to-3D conversion),去隔行演算法(de-interlacing),運動估計運動補償演算法(Motion estimation/Motion Compensation),去噪演算法(Noise Rection),縮放演算法(scaling),銳化處理演算法(Sharpness),超解析度演算法(Super Resolution),手勢識別(gesture recognition),人臉識別(face recognition)。

關於演算法工程師可以到CDA認證機構了解一下,CDA行業標准由國際范圍數據領域的行業專家、學者及知名企業共同制定並每年修訂更新,確保了標準的公立性、權威性、前沿性。通過CDA認證考試者可獲得CDA中英文認證證書。

閱讀全文

與運動估計演算法matlab相關的資料

熱點內容
程序員在廣州上班 瀏覽:800
androidlinuxadt 瀏覽:510
廣聯達軟體加密鎖原裝晶元 瀏覽:338
如何打開資料庫伺服器 瀏覽:310
kppm是什麼app 瀏覽:538
python多個數組命名 瀏覽:191
a演算法csdn 瀏覽:23
r720伺服器什麼年代 瀏覽:975
本地電腦怎麼設置傳奇伺服器 瀏覽:1002
安卓10框架怎麼製作 瀏覽:959
程序員退休工資待遇 瀏覽:609
湛江中文編程數控系統代理 瀏覽:419
openglandroid書 瀏覽:170
奇妙組件安卓版叫什麼 瀏覽:729
微信授權什麼app權重最高 瀏覽:11
php循環數組foreach 瀏覽:78
zip和app有什麼區別 瀏覽:633
乖法快速演算法 瀏覽:872
日本程序員一年工資 瀏覽:199
出國做程序員怎麼樣 瀏覽:736