導航:首頁 > 文件處理 > 壓縮感知超分辨

壓縮感知超分辨

發布時間:2023-10-28 01:54:30

壓縮感知的歷史背景

盡管壓縮感知是由 E. J. Candes、J. Romberg、T. Tao 和D. L. Donoho 等科學家於2004 年提出的。但是早在上個世紀,相關領域已經有相當的理論和應用鋪墊,包括圖像處理、地球物理、醫學成像、計算機科學、信號處理、應用數學等。
可能第一個與稀疏信號恢復有關的演算法由法國數學家Prony 提出。這個被稱為的Prony 方法的稀疏信號恢復方法可以通過解一個特徵值問題,從一小部分等間隔采樣的樣本中估計一個稀疏三角多項式的非零幅度和對應的頻率。而最早採用基於L1范數最小化的稀疏約束的人是B. Logan。他發現在數據足夠稀疏的情況下,通過L1范數最小化可以從欠采樣樣本中有效的恢復頻率稀疏信號。D. Donoho和B.Logan 是信號處理領域採用L1范數最小化稀疏約束的先驅。但是地球物理學家早在20 世紀七八十年代就開始利用L1范數最小化來分析地震反射信號了。上世紀90 年代,核磁共振譜處理方面提出採用稀疏重建方法從欠采樣非等間隔樣本中恢復稀疏Fourier 譜。同一時期,圖像處理方面也開始引入稀疏信號處理方法進行圖像處理。在統計學方面,使用L1范數的模型選擇問題和相關的方法也在同期開始展開。
壓縮感知理論在上述理論的基礎上,創造性的將L1范數最小化稀疏約束與隨機矩陣結合,得到一個稀疏信號重建性能的最佳結果。
壓縮感知基於信號的可壓縮性, 通過低維空間、低解析度、欠Nyquist采樣數據的非相關觀測來實現高維信號的感知,豐富了關於信號恢復的優化策略,極大的促進了數學理論和工程應用的結合 。它是傳統資訊理論的一個延伸,但是又超越了傳統的壓縮理論,成為了一門嶄新的子分支。它從誕生之日起到現在不過五年時間,其影響卻已經席捲了大半個應用科學。

❷ 壓縮感測的原理

核心思想是將壓縮與采樣合並進行,首先採集信號的非自適應線性投影 (測量值),然後根據相應重構演算法由測量值重構原始信號。壓縮感測的優點在於信號的投影測量數據量遠遠小於傳統采樣方法所獲的數據量,突破了香農采樣定理的瓶頸,使得高解析度信號的採集成為可能。
信號的稀疏表示就是將信號投影到正交變換基時,絕大部分變換系數的絕對值很小,所得到的變換向量是稀疏或者近似稀疏的,以將其看作原始信號的一種簡潔表達,這是壓縮感測的先驗條件,即信號必須在某種變換下可以稀疏表示。 通常變換基可以根據信號本身的特點靈活選取, 常用的有離散餘弦變換基、快速傅里葉變換基、離散小波變換基、Curvelet基、Gabor 基 以及冗餘字典等。 在編碼測量中, 首先選擇穩定的投影矩陣,為了確保信號的線性投影能夠保持信號的原始結構, 投影矩陣必須滿足約束等距性 (Restricted isometry property, RIP)條件, 然後通過原始信號與測量矩陣的乘積獲得原始信號的線性投影測量。最後,運用重構演算法由測量值及投影矩陣重構原始信號。信號重構過程一般轉換為一個最小L0范數的優化問題,求解方法主要有最小L1 范數法、匹配追蹤系列演算法、最小全變分方法、迭代閾值演算法等。
采樣定理(又稱取樣定理、抽樣定理)是采樣帶限信號過程所遵循的規律,1928年由美國電信工程師H.奈奎斯特首先提出來的,因此稱為奈奎斯特采樣定理。1948年資訊理論的創始人C.E.香農對這一定理加以明確說明並正式作為定理引用,因此在許多文獻中又稱為香農采樣定理。該理論支配著幾乎所有的信號/圖像等的獲取、處理、存儲、傳輸等,即:采樣率不小於最高頻率的兩倍(該采樣率稱作Nyquist采樣率)。該理論指導下的信息獲取、存儲、融合、處理及傳輸等成為信息領域進一步發展的主要瓶頸之一,主要表現在兩個方面:
(1)數據獲取和處理方面。對於單個(幅)信號/圖像,在許多實際應用中(例如,超寬頻通信,超寬頻信號處理,THz成像,核磁共振,空間探測,等等), Nyquist采樣硬體成本昂貴、獲取效率低下,在某些情況甚至無法實現。為突破Nyquist采樣定理的限制,已發展了一些理論,其中典型的例子為Landau理論, Papoulis等的非均勻采樣理論,M. Vetterli等的 finite rate of innovation信號采樣理論,等。對於多道(或多模式)數據(例如,感測器網路,波束合成,無線通信,空間探測,等),硬體成本昂貴、信息冗餘及有效信息提取的效率低下,等等。
(2)數據存儲和傳輸方面。通常的做法是先按照Nyquist方式獲取數據,然後將獲得的數據進行壓縮,最後將壓縮後的數據進行存儲或傳輸,顯然,這樣的方式造成很大程度的資源浪費。另外,為保證信息的安全傳輸,通常的加密技術是用某種方式對信號進行編碼,這給信息的安全傳輸和接受帶來一定程度的麻煩。
綜上所述:Nyquist-Shannon理論並不是唯一、最優的采樣理論,研究如何突破以Nyquist-Shannon采樣理論為支撐的信息獲取、處理、融合、存儲及傳輸等的方式是推動信息領域進一步往前發展的關鍵。眾所周知:(1)Nyquist采樣率是信號精確復原的充分條件,但絕不是必要條件。(2)除帶寬可作為先驗信息外,實際應用中的大多數信號/圖像中擁有大量的structure。由貝葉斯理論可知:利用該structure信息可大大降低數據採集量。(3) Johnson-Lindenstrauss理論表明:以overwhelming性概率,K+1次測量足以精確復原N維空間的K-稀疏信號。
由D. Donoho(美國科學院院士)、E. Candes(Ridgelet, Curvelet創始人)及華裔科學家T. Tao(2006年菲爾茲獎獲得者,2008年被評為世界上最聰明的科學家)等人提出了一種新的信息獲取指導理論,即,壓縮感知或壓縮感測(Compressive Sensing(CS) or Compressed Sensing、Compressed Sampling)。該理論指出:對可壓縮的信號可通過遠低於Nyquist標準的方式進行采樣數據,仍能夠精確地恢復出原始信號。該理論一經提出,就在資訊理論、信號/圖像處理、醫療成像、模式識別、地質勘探、光學/雷達成像、無線通信等領域受到高度關注,並被美國科技評論評為2007年度十大科技進展。CS理論的研究尚屬於起步階段,但已表現出了強大的生命力,並已發展了分布CS理論(Baron等提出),1-BIT CS理論(Baraniuk等提出),Bayesian CS理論(Carin等提出),無限維CS理論(Elad等提出),變形CS理論(Meyer等提出),等等,已成為數學領域和工程應用領域的一大研究熱點。

❸ 學習了哪些知識,計算機視覺才算入門

計算機視覺是一個很大的范疇的總和,有兩種學習方式,一種是閱讀基礎書,搞懂它的每一部分;另一種是找一個問題,看文獻,編程實現,不斷往深走。這兩種學習方式是互補的,如果你看了好幾年書還不能上手解決問題,或者只會解決某些很特殊的問題,對其他問題束手無策都不算成功。因此你需要把看書掌握一般知識和編程實驗解決具體問題齊頭並進。下面說你要干什麼:

下載安裝OpenCV2

OpenCV是一個非常強大的計算機視覺庫,包括了圖像處理、計算機視覺、模式識別、多視圖幾何的許多基本演算法,有c++和Python兩種介面。學習的材料首先是安裝目錄下doc文件夾里的幫助文檔,提供所有函數的用法,任何時候對任何函數有疑問請查閱幫助文檔,安裝目錄下還提供一大堆寫好的演示程序供參考;《OpenCV_2 Computer Vision Application Programming Cookbook》是一本比較基礎的介紹材料,它的缺點是沒有介紹分類器(模式識別)方面的函數怎麼用。

雖然網上還有其他很多流行的庫,比如處理特徵點的VLfeat,處理點雲的PCL,處理GPU運算的CUDA,處理機器人問題的ROS和MRPT,但是這些都是你在解決具體問題時才會考慮去用的東西,如果你想快速讀取視頻、做個屏幕交互程序、使用流行的分類器、提取特徵點、對圖像做處理、進行雙目重建,OpenCV都提供相應函數,因此在你不知道該把餘生用來干什麼的時候,先裝OpenCV學習。

讀綜述

Computer Vision: Algorithms and Application。這本書用1000頁篇幅圖文並茂地瀏覽了計算機視覺這門學科的諸多大方向,如果你不知道計算機視覺是一門搞什麼的學科,這本書是你絕佳的選擇。它的優點是涉獵了大量文獻,缺點是缺乏細節,因此很顯然只讀這本書你根本沒法上手工作,因為它講的實在是太粗糙了。如果你對其中的某一部分感興趣,就請去讀相關文獻,繼續往下走,這就是這本書的意義。有中文版,但是翻譯的不好,也不建議你細細去讀,看看裡面的圖片即可。

Computer Vision: Models, Learning, and Inference:這本書是我認為研究生和高年級本科生入門計算機視覺最好的教材。它內容豐富,難度適中,推導翔實,語言流暢,強烈推薦你花2個月時間把這本書讀完。

多視圖幾何

Multiple View Geometry in Computer Vision:這本書是多視圖幾何的聖經,意思就是說想搞三維重建或者圖像測量之類的項目,這本書是必讀的。它需要你有線性代數的基本知識,會SVD分解即可。第一版有中文版,翻譯的非常好,但是已經絕版了,可以上淘寶高價買一本,第二版添加的內容很少,在網上可以下載到。

模式識別

模式識別核心就是訓練一個函數來擬合手頭的數據,如果數據的標簽是離散的,稱為分類問題,如數據的標簽是連續的,稱為回歸問題;分類又分有監督分類和無監督分類,有監督分類器有神經網路、支持向量機、AdaBoost、隨機場、樹模型等等。當你拿到一大堆數據,需要從裡面找關系的時候,一般都需要使用模式識別演算法來訓練一個函數/分類器/模型,因此模式識別是機器學習的核心。
《模式分類(第二版)》:這是一本適合普通讀者閱讀的教材,介紹了模式識別中經典的分類器,講解細致,語言生動,難度適中,每一個演算法都有偽代碼。

The Elements of Statistical Learning:這本書使用嚴謹的數學工具分析模式識別演算法,它比較難,但是非常深刻。每拿到一個模型它都會分析這個模型在數學上是如何構造的,並且推導模型的分類錯誤率。分析和推導是這本書的精髓。

Pattern Recognition and Machine Learning:這是一本從貝葉斯學派的角度分析模式識別模型的書,它使用的工具主要是概率論,比較難,非常深刻,內容非常豐富。

雖然這兩本書很難,但是它們用到的數學知識不過是基本的概率論和線性代數,只是用的比較活,計算機視覺這個學科需要的數學知識也是這個水平。

圖形學

圖形學教材首先推薦《計算機圖形學與幾何造型導論》,這本書用流暢的語言介紹了圖形學的基礎知識,選材有趣,推導簡潔但是絕不跳步走,保證你能看懂而且不會看煩。

光線追蹤器我看過一本薄的《Realistic Ray Tracing》和一本厚的《Ray Tracing from the Ground Up》,兩本書都有代碼。後一本內容極其豐富,有中文版,翻譯尚可。後一本唯一的缺點就是講不清楚BRDF,但這恰恰是前一本的亮點。

還有一些比較偏的書,比如偏微分方程在圖像處理中的應用、細分、壓縮感知、馬爾科夫隨機場、超解析度分析,概率機器人、多尺度幾何分析,這些領域都有各自的名著,你在某個領域深挖的時候,類似這樣的書可能會出現在參考文獻中,那時再看不遲。

讀文獻
寫到書里的知識基本上都有些過時,你得通過看文獻掌握各個領域最新的發展動態。計算機視覺的頂級期刊有兩個PAMI和IJCV,頂級會議有ICCV和CVPR,在科學網—[轉載]計算機視覺方向的一些頂級會議和期刊有更加詳細的介紹。

閱讀全文

與壓縮感知超分辨相關的資料

熱點內容
薩繆爾森微觀經濟學pdf 瀏覽:176
docker解決go的交叉編譯 瀏覽:429
考前解壓還有激勵 瀏覽:578
程序員應該具備的素質 瀏覽:512
如何加密qq空間日誌 瀏覽:432
環衛車壓縮箱有多重 瀏覽:746
換手率app怎麼沒有自媒體了 瀏覽:407
安卓如何區分展示機和正品機 瀏覽:371
java運行和編譯命令 瀏覽:543
手機解壓30g文件要多久 瀏覽:708
php讀取文件格式 瀏覽:612
開發程序員的電影 瀏覽:743
pc端解壓文件下載 瀏覽:708
單片機C語言讀寄存器 瀏覽:164
linux火車源碼 瀏覽:793
小米手機應用加密怎樣解除 瀏覽:523
幫孩子解壓的句子 瀏覽:140
木匠編程 瀏覽:832
笑話pdf 瀏覽:441
pdf變形 瀏覽:856