導航:首頁 > 源碼編譯 > 圖像與演算法應用題

圖像與演算法應用題

發布時間:2022-12-14 15:08:31

㈠ 百分求問——圖像演算法問題:選區為不規則四邊形,怎麼用把它轉換成一個長方形的圖片

大概你是想用左邊的4個點內像素投到右邊的4個點形成矩形圖像把。圖像的幾何變換一邊都是用原圖像和一個3×3的變換矩形相乘來得到的,像你這種應該是屬於投影變換,即用四個對應的點坐標來解3×3變換矩陣中的變換系數,然後用原圖像所有的點來乘以這個變換系數得到其在這種投影關系下新的坐標。
能否詳細描述下你指的不理想?我猜測的話可能會碰到以下幾種情況:
1.投影後出現空洞,由於原圖的投影結果不可能覆蓋到所有的目標圖像位置,所以必須採用反向投影解決。
2.投影出現鋸齒,由於插值後取整數位置引起,採用雙線性或更高的三次卷積插值會好點
3.顏色不正常,可能從RGB轉到YUV後再進行投影變化可解決。

㈡ 專題圖像處理

利用製作好的TM基礎影像圖目視解譯後,仍有某些難以確定的重要地質要素、地質特徵需進行相應的數字圖像增強處理,以有效地突出有用信息,抑制植被、冰雪等其他干擾因素,改善圖像的視覺效果,提高重現圖像的逼真度,增強信息提取與識別能力。

為了突出岩石地層、控煤構造和含煤區小構造、含煤地層及煤層等信息,增加圖像的可解譯程度,提高解譯效果,針對地質條件復雜和重點含煤區,利用ENVI遙感圖像處理軟體作進一步的數字圖像增強處理,以達到有效提取相關信息的目的。處理方法主要有主成分分析、直方圖均衡化、定向濾波、比值處理和銳化增強等十餘種方法,達到了對地質體、煤層分類和識別的目的,完善了解譯效果。

圖像增強處理雖然不能增加圖像數據中的相關信息,但它能夠增加所選特徵的動態范圍,從而使這些特徵的檢測和識別更加容易。在芒棒區、中甸區和永勝區共選取20個子區進行處理(表2-1),目的有三:①對影像中的模糊區進行處理,增強其可解譯程度;②對與煤田地質關系密切的研究對象進行處理,提高可解譯程度;③對直接和間接地反映煤及其他礦產異常的影像特徵進行處理,增強目視解譯的識別能力。使用的主要方法有:主成分分析、去相關拉伸、比值運算、芒塞爾彩色空間變換、非監督分類等。具體操作時,為了獲取理想的效果,往往以其中一種方法為主,疊加其他方法進行運算,最後選擇效果較好的處理結果進行輸出。現將所使用主要處理方法及各子區特徵分述如下:

表2-1 子區編號、位置及提取信息內容

(一)KL變換(主成分分析)

KL(Karhunen-LoeveTransform,卡洛南—洛伊變換)變換是遙感圖像增強和信息提取中常用的波譜信息線性投影變換,在盡可能不減少信息量的前提下,將原圖像的高維多光譜空間像元亮度值投影到新的低維空間,減少特徵空間維數,達到數據壓縮、提高信噪比、降維處理和提取圖像特徵信息的目的。它可使原來多波段圖像經變換後提供出一組不相關的圖像變數,最前面的主分量具有較大的方差,包含了原始影像的主要信息,此方法對於原始圖像上那些信息微弱、模糊、離散度大的地質信息的增強處理,能夠起到聚集和歸並的作用,同時也能夠壓制陰影、雲霧和雪蓋的顯示強度。所以要集中表達信息,突出圖像的某些細部特徵,可採用KL變換處理(圖2-2)。芒棒全區經過KL變換後的圖像,影紋結構細膩,水系、地貌等特徵反映更加明顯;對永勝金沙江背斜採用主成分分析+直方圖均衡化的方法進行處理,褶皺和斷裂特徵非常明顯,玄武岩組各段的分界清晰。

(二)去相關拉伸變換

對相關性高的波段進行去相關拉伸處理,減弱它們之間的相關性,從而使深色區域的地物差異界線反映得更加清楚。勐連盆地子區經過去相關拉伸變換後盆地邊界與周圍岩層差異明顯,盆地邊界清晰,隱伏斷裂也更容易識別(圖2-3);永勝全區經去相關拉伸變換後,有效地突出了各岩石地層及構造的影像特徵。

圖2-2 芒棒區KL變換圖像

(三)紋理特徵提取變換

紋理特徵提取方法是用一個活動的窗口在圖像上連續滑動,分別計算出窗口中的方差、均值、最大值、最小值及二者之差和信息熵等,形成相應的紋理圖像,當目標的光譜特性比較接近時,紋理特徵對於區分目標可以起到積極的作用。選取適當的數據動態變化范圍,進行紋理特徵提取後,使影像的紋理特徵得到突出,有利於提取構造信息。對中甸幅的小中甸東子區進行紋理特徵提取變換後,子區的信息豐富,線性特徵明顯;永勝子區採用紋理特徵提取變換後,松桂組含煤地層與其上覆、下伏地層的紋理特徵差異明顯,提高了圖像的可解譯程度(圖2-4)。

(四)銳化增強

調整圖像的銳化程度使地物在圖像上的差別便於人眼識別,可達到信息增強的目的。對圖像進行銳化增強實際上是利用變換函數把原圖像進行灰度級轉換,增大相鄰像元的灰度值之差,從而達到突出圖像細節的目的,對中甸幅尼西盆地子區進行銳化增強後,盆地邊界清晰,影紋細膩(圖2-5)。

圖2-3 勐連盆地子區去相關拉伸圖像

(五)定向濾波

利用定向濾波對TM圖像頻率特徵進行篩選,將圖像中的線與邊緣特徵信息增強,突出給定方向的線性影像信息,抑制其他方向的無用信息。對芒棒盆地子區採用45°方向濾波後,突出了斷裂的線性影像,斷裂兩側的影像色調、花紋明顯不同,斷裂造成的山脊錯斷等特徵在影像上非常明顯;採用該方法處理後,程海逆沖斷裂的位置、走向及其展布特徵非常明顯,外來系統與原地系統的岩石組合和構造發育特徵截然不同(圖2-6)。

(六)纓帽變換

採用纓帽變換可將TM圖像除熱紅外波段的6個波段壓縮成3個分量,其中的土壤亮度指數分量是6個波段的加權和,反映了總體的反射值;綠色植被指數分量反映了綠色生物量的特徵;土壤特徵分量反映了可見光和近紅外與較長紅外光的差值,它對土壤濕度和植物濕度最為敏感。這樣的3個分量就是TM數據進行纓帽變換後形成的新空間,它可以對植被、土壤等地物做更為細致、准確的分析,應用這種處理方法可增強影像上深色區域的信息。對騰沖火山機構子區進行纓帽變換後,再進行對比度增強處理,圖像中火山岩岩體邊界、火山口形態、紋理以及色調都得到了有效的突出(圖2-7);金棉逆沖斷裂經纓帽變換後信息豐富,特徵明顯。

圖2-4 永勝子區紋理特徵提取變換圖像

圖2-5 中甸子區銳化增強圖像

圖2-6 程海逆沖斷裂135°定向濾波圖像

圖2-7 騰沖火山機構子區纓帽變換圖像

(七)芒塞爾彩色空間變換

在計算機內定量處理色彩時通常採用紅、綠、藍三原色組成的彩色空間RGB表色系統,但在視覺上定性的描述色彩時,採用HSV(Hue〈色度〉、Saturation〈飽和度〉、Value〈純度〉)顯色系統更直觀些。Munsell HSV變換就是對彩色合成圖像在紅、綠、藍編碼賦色方面的一種彩色圖像增強方法,它是藉助於改變彩色合成過程中光學參數的變化來擴展圖像色調差異,將圖像彩色坐標中的RGB(Red Green Blue)空間變換為HSV色彩模型。其目的是為了更有效地抑制地形效應和增強岩石單元的波段差異,並通過彩色編碼增強處理達到最佳的圖像顯示效果。對中甸幅雪蓋區進行處理後可以看出,雪蓋區可識別程度比原來大大提高,被雪覆蓋的山脊清晰可辨;對永勝區竹山、葯山的陰影區進行芒塞爾彩色空間變換處理,有效突出了陰影區的微地貌及其紋理特徵,地質體邊界更加清晰,可解譯程度大大提高(圖2-8)。

圖2-8 永勝區竹山陰影區芒塞爾彩色空間變換

(八)非監督分類

由於遙感圖像上的同類地物在相同的表面結構、植被覆蓋、光照等條件下有相同或相近的光譜特徵,而相似波譜的像元點必然在光譜空間的相應部位集結成群。因此可按這些自然集群劃分類別,然後與野外實際調查的地面情況進行對比,確定各類地物屬性。這種方法能把樣本區分為若干類別,卻不能給出樣本的描述。對中甸區的小中甸盆地子區採用非監督分類中的K-均值演算法,其基本思想是通過迭代,逐次移動各類的中心,直至得到最好的聚類結果為止,這種演算法是一個迭代演算法,迭代過程中類別中心按最小二乘誤差的原則進行移動,因此類別中心的移動是合理的。其缺點是要事先已知類別數,在實際中類別數通常根據試驗的方法來確定,本次工作經過多次試驗最後採用類別數為15的演算法。小中甸盆地子區的分類結果與野外情況基本相符,不足之處是對相同或相近波譜特徵的不同地物容易產生分類誤差(圖2-9)。

(九)波段彩色合成

對兩個波段的圖像進行波段合成,可突出類別或目標信息,消除山影、雲影等的影響,區分易混淆的地物,從芒棒區蒲川盆地子區處理的結果可以看出,盆地的邊界和植被信息得到了增強,從而使盆地邊界的圈定更加直觀;對永勝寧利子區採用該方法處理後,黑泥哨組和松桂組含煤地層的影像特徵更加明顯,走向及邊界更為清晰(圖2-10)。

圖2-9 中甸子區K-均值演算法非監督分類圖像

圖2-10 芒棒區蒲川盆地子區波段彩色合成圖像

(十)對數變換

對數變換的主要作用是壓縮圖像亮區的灰階值,拉伸暗區的灰階值,從而突出暗區的構造形跡。對中甸北老地層子區進行對數變換後可以看出,子區的色彩豐富,影紋清晰,有利於岩性的識別(圖2-11)。

(十一)比值處理

比值處理採用高質量比值功能,使圖像得到拉伸,有效消除地形影響,使陰影區的結構得到顯示。處理出來的圖像既保留了原有地貌特徵,又突出了線環構造,為盆地的研究提供了更為直觀可靠的資料,中甸盆地子區經過比值處理後,立體感得到增強,陰影區結構清楚,盆地邊界一目瞭然;採用7/4、5/2、5/3比值運算增強處理方法對寶坪銅礦區及米厘 寶坪銅礦遠景區的圍岩蝕變信息進行增強處理,其蝕變信息豐富,特徵非常明顯(圖2-12)。

圖2-11 中甸北老地層子區對數變換圖像

圖2-12 永勝區寶坪銅礦區圍岩蝕變信息比值運算圖像

(十二)對比度擴展

對圖像統一採用一種灰度標尺的變換,使影像反差擴展到整個動態范圍,這種反差處理根據一個固定的變換關系,逐個像素地改變灰度值,提高地物反差,以達到反差增強的目的,本次工作選取的變換關系有線性擴展、非線性函數變換和直方圖均衡化處理。

(十三)波段運算

即對各相關波段進行數學運算,通過運算有效地消除或減弱對主題目標干擾嚴重的無用信息,使得處理後的圖像既保留原有總體特徵,又突出了個別有用信息。

另外,本次工作還進行了拉普拉斯卷積濾波、羅伯特卷積濾波、中值濾波、低通濾波、高通濾波及圖像融合等多種圖像處理方法,也取得了較好的效果,在此不再贅述。

㈢ 圖像分割演算法總結

       圖像處理的很多任務都離不開圖像分割。因為圖像分割在cv中實在太重要(有用)了,就先把圖像分割的常用演算法做個總結。

        接觸機器學習和深度學習時間已經不短了。期間看過各種相關知識但從未總結過。本文過後我會盡可能詳細的從工程角度來總結,從傳統機器學習演算法,傳統計算機視覺庫演算法到深度學習目前常用演算法和論文,以及模型在各平台的轉化,量化,服務化部署等相關知識總結。

        圖像分割常用演算法大致分為下面幾類。由於圖像的能量范函,邊緣追蹤等方法的效果往往只能解決特定問題,效果並不理想,這里不再闡述。當然二值化本身也可以分割一些簡單圖像的。但是二值化演算法較多,我會專門做一個文章來總結。這里不再贅述。

        1.基於邊緣的圖像分割演算法:

            有利用圖像梯度的傳統演算法運算元的sobel,roberts,prewitt,拉普拉斯以及canny等。

            這些演算法的基本思想都是採用合適的卷積運算元,對圖像做卷積。從而求出圖像對應的梯度圖像。(至於為什麼通過如圖1這樣的運算元卷積,即可得到圖像的梯度圖像,請讀者復習下卷積和倒數的概念自行推導)由於圖像的邊緣處往往是圖像像素差異較大,梯度較大地方。因此我們通過合適的卷積核得到圖像的梯度圖像,即得到了圖像的邊緣圖像。至於二階運算元的推導,與一階類似。優點:傳統運算元梯度檢測,只需要用合適的卷積核做卷積,即可快速得出對應的邊緣圖像。缺點:圖像邊緣不一定準確,復雜圖像的梯度不僅僅出現在圖像邊緣,可以能出現在圖像內部的色彩和紋理上。

             也有基於深度學習方法hed,rcf等。由於這類網路都有同一個比較嚴重的缺陷,這里只舉例hed網路。hed是基於FCN和VGG改進,同時引出6個loss進行優化訓練,通過多個層輸出不同scale的粒度的邊緣,然後通過一個訓練權重融合各個層的邊緣結果。hed網路結構如下:

可以得到一個比較完整的梯度圖像,可參考github的hed實現。優點:圖像的梯度細節和邊緣完整性,相比傳統的邊緣運算元要好很多。但是hed對於邊緣的圖像內部的邊緣並不能很好的區分。當然我們可以自行更改loss來嘗試只擬合外部的圖像邊緣。但最致命的問題在於,基於vgg的hed的網路表達能力有限,對於圖像和背景接近,或者圖像和背景部分相融的圖片,hed似乎就有點無能為力了。

        2.基於區域分割的演算法:

            區域分割比較常用的如傳統的演算法結合遺傳演算法,區域生長演算法,區域分裂合並,分水嶺演算法等。這里傳統演算法的思路是比較簡單易懂的,如果有無法理解的地方,歡迎大家一起討論學習。這里不再做過多的分析。

            基於區域和語意的深度學習分割演算法,是目前圖像分割成果較多和研究的主要方向。例如FCN系列的全卷積網路,以及經典的醫學圖像分割常用的unet系列,以及rcnn系列發展下的maskrcnn,以及18年底的PAnet。基於語意的圖像分割技術,無疑會成為圖像分割技術的主流。

            其中,基於深度學習語意的其他相關演算法也可以間接或直接的應用到圖像分割。如經典的圖像matting問題。18年又出現了許多非常優秀的演算法和論文。如Deep-Image-Matting,以及效果非常優秀的MIT的 semantic soft segmentation(sss).

            基於語意的圖像分割效果明顯要好於其他的傳統演算法。我在解決圖像分割的問題時,首先嘗試用了hed網路。最後的效果並不理想。雖然也參考github,做了hed的一些fine-tune,但是還是上面提到的原因,在我多次嘗試後,最終放棄。轉而適用FCN系列的網路。但是fcn也無法解決圖像和背景相融的問題。圖片相融的分割,感覺即需要大的感受野,又需要未相融部分原圖像細節,所以單原FCN的網路,很難做出准確的分割。中間還測試過很多其他相關的網路,但都效果不佳。考慮到感受野和原圖像細節,嘗試了resnet和densenet作為圖像特徵提取的底層。最終我測試了unet系列的網路:

                unet的原始模型如圖所示。在自己拍照爬蟲等手段採集了將近1000張圖片。去掉了圖片質量太差的,圖片內容太過類似的。爬蟲最終收集160多張,自己拍照收集200張圖片後,又用ps手動p了邊緣圖像,採用圖像增強變換,大約有300*24張圖片。原生unet網路的表現比較一般。在將unet普通的卷積層改為resnet後,網路的表達能力明顯提升。在將resnet改為resnet101,此時,即使對於部分相融的圖像,也能較好的分割了。但是unet的模型體積已經不能接受。

                在最後階段,看到maskrcnn的實例分割。maskrcnn一路由rcnn,fasterrcnn發展過來。於是用maskrcnn來加入自己的訓練數據和label圖像進行訓練。maskrcnn的結果表現並不令人滿意,對於邊緣的定位,相比於其他演算法,略顯粗糙。在產品應用中,明顯還不合適。                

        3.基於圖的分割演算法

            基於深度學習的deepgrab,效果表現並不是十分理想。deepgrab的git作者backbone採用了deeplabv2的網路結構。並沒有完全安裝原論文來做。

論文原地址參考: https://arxiv.org/pdf/1707.00243.pdf

整體結構類似於encode和decoder。並沒有太仔細的研究,因為基於resent101的結構,在模型體積,速度以及deeplab的分割精度上,都不能滿足當前的需求。之前大致總結過計算機視覺的相關知識點,既然目前在討論移動端模型,那後面就分模塊總結下移動端模型的應用落地吧。

由於時間實在有限。這里並沒有針對每個演算法進行詳細的講解。後續我會從基礎的機器學習演算法開始總結。

㈣ 圖像處理,PIV互相關演算法,利用快速傅里葉變換實現的一些疑問,專業請進,閑人勿擾

互相關,時域的演算法是卷積,頻域演算法不就是相乘么。在頻域相乘的前後還要做fourier正變換和逆變換,因為輸入輸出都是時域的。

最後的c是矩陣,最後一行的作用是把c矩陣中的負數置0,應該是為了後續處理方便,反正最高峰肯定是正的。

㈤ 數字圖像處理的基本演算法及要解決的主要問題

圖像處理,是對圖像進行分析、加工、和處理,使其滿足視覺、心理以及其他要求的技術。圖像處理是信號處理在圖像域上的一個應用。目前大多數的圖像是以數字形式存儲,因而圖像處理很多情況下指數字圖像處理。此外,基於光學理論的處理方法依然佔有重要的地位。

圖像處理是信號處理的子類,另外與計算機科學、人工智慧等領域也有密切的關系。

傳統的一維信號處理的方法和概念很多仍然可以直接應用在圖像處理上,比如降噪、量化等。然而,圖像屬於二維信號,和一維信號相比,它有自己特殊的一面,處理的方式和角度也有所不同。
目錄
[隱藏]

* 1 解決方案
* 2 常用的信號處理技術
o 2.1 從一維信號處理擴展來的技術和概念
o 2.2 專用於二維(或更高維)的技術和概念
* 3 典型問題
* 4 應用
* 5 相關相近領域
* 6 參見

[編輯] 解決方案

幾十年前,圖像處理大多數由光學設備在模擬模式下進行。由於這些光學方法本身所具有的並行特性,至今他們仍然在很多應用領域佔有核心地位,例如 全息攝影。但是由於計算機速度的大幅度提高,這些技術正在迅速的被數字圖像處理方法所替代。

從通常意義上講,數字圖像處理技術更加普適、可靠和准確。比起模擬方法,它們也更容易實現。專用的硬體被用於數字圖像處理,例如,基於流水線的計算機體系結構在這方面取得了巨大的商業成功。今天,硬體解決方案被廣泛的用於視頻處理系統,但商業化的圖像處理任務基本上仍以軟體形式實現,運行在通用個人電腦上。

[編輯] 常用的信號處理技術

大多數用於一維信號處理的概念都有其在二維圖像信號領域的延伸,它們中的一部分在二維情形下變得十分復雜。同時圖像處理也具有自身一些新的概念,例如,連通性、旋轉不變性,等等。這些概念僅對二維或更高維的情況下才有非平凡的意義。

圖像處理中常用到快速傅立葉變換,因為它可以減小數據處理量和處理時間。

[編輯] 從一維信號處理擴展來的技術和概念

* 解析度(Image resolution|Resolution)
* 動態范圍(Dynamic range)
* 帶寬(Bandwidth)
* 濾波器設計(Filter (signal processing)|Filtering)
* 微分運算元(Differential operators)
* 邊緣檢測(Edge detection)
* Domain molation
* 降噪(Noise rection)

[編輯] 專用於二維(或更高維)的技術和概念

* 連通性(Connectedness|Connectivity)
* 旋轉不變性(Rotational invariance)

[編輯] 典型問題

* 幾何變換(geometric transformations):包括放大、縮小、旋轉等。
* 顏色處理(color):顏色空間的轉化、亮度以及對比度的調節、顏色修正等。
* 圖像合成(image composite):多個圖像的加、減、組合、拼接。
* 降噪(image denoising):研究各種針對二維圖像的去噪濾波器或者信號處理技術。
* 邊緣檢測(edge detection):進行邊緣或者其他局部特徵提取。
* 分割(image segmentation):依據不同標准,把二維圖像分割成不同區域。
* 圖像製作(image editing):和計算機圖形學有一定交叉。
* 圖像配准(image registration):比較或集成不同條件下獲取的圖像。
* 圖像增強(image enhancement):
* 圖像數字水印(image watermarking):研究圖像域的數據隱藏、加密、或認證。
* 圖像壓縮(image compression):研究圖像壓縮。

[編輯] 應用

* 攝影及印刷 (Photography and printing)
* 衛星圖像處理 (Satellite image processing)
* 醫學圖像處理 (Medical image processing)
* 面孔識別, 特徵識別 (Face detection, feature detection, face identification)
* 顯微圖像處理 (Microscope image processing)
* 汽車障礙識別 (Car barrier detection)

[編輯] 相關相近領域

* 分類(Classification)
* 特徵提取(Feature extraction)
* 模式識別(Pattern recognition)
* 投影(Projection)
* 多尺度信號分析(Multi-scale signal analysis)
* 離散餘弦變換(The Discrete Cosine Transform)

㈥ 圖像演算法A和B兩張圖片,找出B與A不同的部分

說的很清楚,你也把思路說出來了,就是這樣的,加快網路的傳輸速度。
至於比較方法,比較像素點的方向是對的,不過我想它不是上來就比較像素點,因為這樣效率較低,而是採用的多函數嵌套,方法如下:
把圖片分成幾大塊,比如平均分4塊,然後每一塊進行比對(進行圖片的模糊匹配,而不是精確的像素匹配),找出不同大塊,然後再分塊,以此下去,找到比較小的塊(這個根據編程定義到底多小算小),然後再進行像素比對,這樣效率能夠更加提高。

㈦ 圖像處理

第三章 圖像處理

        輸出圖像的像素值僅僅由輸入圖像的像素值決定。

        1.1 像素變換

              根據像素產生輸出像素,注意,這里的像素可以是多副圖片的像素。

        1.2 顏色變換

              彩色圖像的各通道間具有很強的相關性。

        1.3 合成和映射

              將前景對象從圖像背景中提取出來,被稱為摳圖;將對象插入另一圖像被稱為合成。

        1.4 直方圖均衡化

            對比度和亮度參數可以提升圖像的外觀,為了自動調節這兩個參數,有兩種方法,一種方法是尋找圖像中最亮的值和最暗的值,將它們映射到純白和純黑,另一種方法是尋找圖像的像素平均值,將其作為像素的中間灰度值,然後充滿范圍盡量達到可顯示的值。

        局部自適應直方圖均衡化,對於不同的區域採用不同的均衡化方法。缺點是會產生區塊效應,即塊的邊界處亮度不連續,為了消除這一效應,常採用移動窗口,或者在塊與塊之間的轉換函數進行平滑插值。

        1.5 應用:色調調整

        點運算元的常用領域是對照片的對比度和色調進行操作。

        與點運算元相對應的鄰域運算元是根據選定像素及周圍的像素來決定該像素的 輸出。鄰域運算元不僅用於局部色調調整,還用於圖像平滑和銳化,圖像的去噪。

        鄰域運算元的重要概念是卷積和相關,它們都是線性移不變運算元,滿足疊加原理和移位不變原理。

        填塞,當卷積核超出圖像邊界時,會產生邊界效應。有多種填塞方法,0填塞,常數填塞,夾取填塞,重疊填塞,鏡像填塞,延長。

        2.1 可分濾波器

        如果一個卷積運算可以分解為一維行向量卷積和一維列向量卷積,則稱該卷積核可分離。2D核函數可以看作一個矩陣K,當且僅當K的第一個奇異值為0時,K可分離。

        2.2 線性濾波器舉例

        最簡單的濾波器是移動平均或方框濾波器,其次是雙線性濾波器(雙線性核),高斯濾波器(高斯核),以上均為低通核,模糊核,平滑核。對於這些核函數效果的度量採用傅里葉分析。還有Sobel運算元和角點運算元。

        2.3 帶通和導向濾波器

        Sobel運算元是帶方向的濾波器的近似,先用高斯核平滑圖像,再用方向導數(拉普拉斯運算元)作用於圖像,得到導向濾波器,導向具有潛在的局部性以及很好的尺度空間特性。導向濾波器常用來構造特徵描述子和邊緣檢測器,線性結構通常被認為是類似邊緣的。

        區域求和表是指一定區域內所有像素值的和,又稱為積分圖像,它的有效計算方法是遞歸演算法(光柵掃描演算法),區域求和表用於對其他卷積核的近似,人臉檢測中的多尺度特徵,以及立體視覺中的差分平方和的計算。

        遞歸濾波器稱為無限脈沖響應(IIR),有時用於二維距離函數和連通量的計算,也可計算大面積的平滑計算。

       

        3.1 非線性濾波器

        中值濾波可以去除散粒雜訊,它的另一個優點是保邊平滑,即在濾除高頻雜訊時,邊緣不容易被柔化。

        雙邊濾波器思想的精髓在於,抑制與中心像素值差別較大的像素,而不是抑制固定百分比 的像素。在加權濾波器的基礎上,對權重系數進行了控制,即取決於定義域核(高斯核)和值域核(與中心像素值的相似度),兩者相乘得到雙邊濾波器核。

        迭代自適應平滑核各項異性擴散。

        3.2 形態學

        非線性濾波常用於二值圖像處理,二值圖像中最常見的運算元是形態學運算元,將二值結構元素與二值圖像卷積,根據卷積結果的閾值選擇二值輸出,結構元素可以是任何形狀。

        常見的形態學操作有膨脹,腐蝕,過半,開運算,閉運算。過半使銳利的角變得平滑,開運算和閉運算去除圖像中小的點和孔洞,並使圖像平滑。

        3.3 距離變換

        距離變換通過使用兩遍光柵掃描法,快速預計算到曲線或點集的距離,包括城街距離變換和歐氏距離變換。符號距離變換是基本距離變換的擴展,計算了所有像素到邊界像素的距離。

        3.4 連通域

        檢測圖像的連通量是半全局的圖像操作,連通量定義為具有相同輸入值的鄰接像素的區域,二值或多值圖像被分割成連通量形式後,對每個單獨區域計算統計量,面積,周長,質心,二階矩,可用於區域排序和區域匹配。

          傅里葉變換用於對濾波器的頻域特徵進行分析,FFT能快速實現大尺度核的卷積。

          思想:為了分析濾波器的頻率特徵,將一個已知頻率的正弦波通過濾波器,觀察正弦波變弱的程度。傅里葉變換可認為是輸入信號為正弦信號s(x),經過濾波器h(x)後,產生的輸出響應為正弦信號o(x)=s(x)*h(x),即兩者的卷積。傅里葉變換是對每個頻率的幅度和相位響應的簡單羅列。傅里葉變換不僅可以用於濾波器,還能用於信號和圖像。

          傅里葉變換的性質:疊加,平移,反向,卷積,相關,乘,微分,定義域縮放,實值圖像,Parseval定理。

      4.1 傅里葉變換對

      常見的傅里葉變換對,連續的和離散的。方便進行傅里葉變換。

        高頻成分將在降采樣中導致混疊。

      4.2 二維傅里葉變換

        為了對二維圖像及濾波器進行處理,提出了二維傅里葉變換,與一維傅里葉變換類似,只不過用向量代替標量,用向量內積代替乘法。

        4.3 維納濾波器

        傅里葉變換還可用於分析一類圖像整體的頻譜,維納濾波器應運而生。假定這類圖像位於隨機雜訊場中,每個頻率的期望幅度通過功率譜給出,信號功率譜捕獲了空間統計量的一階描述。維納濾波器適用於去除功率譜為P的圖像雜訊的濾波器。

        維納濾波器的性質,對於低頻具有 單位增益,對於高頻,具有減弱的效果。

        離散餘弦變換(DCT)常用於處理以塊為單位的圖像壓縮,它的計算方法是將以N為寬度的塊內的像素與一系列不同頻率的餘弦值進行點積來實現。

        DCT變換的實質是對自然圖像中一些小的區域的最優KL分解(PCA主成分分析的近似),KL能有效對信號去相關。

        小波演算法和DCT交疊變種能有效去除區塊效應。

        4.4 應用:銳化,模糊,去噪

          銳化和去雜訊能有效增強圖像,傳統的方法是採用線性濾波運算元,現在廣泛採用非線性濾波運算元,例如加權中值和雙邊濾波器,各向異性擴散和非局部均值,以及變分方法。

          度量圖像去噪演算法效果時,一般採用峰值信噪比(PNSR),結構相似性(SSIM)索引。

        迄今為止所研究的圖像變換輸出圖像大小均等於輸入圖像的大小,為了對不同解析度的圖像進行處理,比如,對小圖像進行插值使其與電腦的解析度相匹配,或者減小圖像的大小來加速演算法的執行或節省存儲空間和傳輸時間。

        由於不知道處理圖像所需的解析度,故由多幅不同的圖像構建圖像金字塔,從而進行多尺度的識別和編輯操作。改變圖像解析度較好的濾波器是插值濾波器和降采樣濾波器。

      5.1 插值

        為將圖像變大到較高解析度,需要用插值核來卷積圖像,二次插值常用方法是雙線性插值,雙三次插值,窗函數。窗函數被認為是品質最高的插值器,因為它既可以保留低解析度圖像中的細節,又可以避免混疊。

        5.2 降采樣

        降采樣是為了降低圖像解析度,先用低通濾波器卷積圖像,避免混疊,再保持第r個樣例。常用的降采樣濾波器有線性濾波器,二次濾波器,三次濾波器,窗餘弦濾波器,QMF-9濾波器,JPEG2000濾波器。

        5.3 多解析度表示

        通過降采樣和插值演算法,能夠對圖像建立完整的圖像金字塔,金字塔可以加速由粗到精的搜索演算法,以便在不同的尺度上尋找物體和模式,或進行多解析度融合操作。

        計算機視覺中最有名的金字塔是拉普拉斯金字塔,採用大小為2因子對原圖像進行模糊和二次采樣,並將它存儲在金字塔的下一級。

      5.4 小波變換

        小波是在空間域和頻率域都定位一個信號的濾波器,並且是在不同層次的尺度上定義的。小波可以進行多尺度有向濾波和去噪。與常規的金字塔相比,小波具有更好的方向選擇性,並提供了緊致框架。

        提升小波被稱為第二代小波,很容易適應非常規采樣拓撲,還有導向可移位多尺度變換,它們的表述不僅是過完備的,而且是方向選擇的。

      5.5 應用:圖像融合

        拉普拉斯金字塔的應用,混合合成圖像。要產生混合圖像,每個原圖像先分解成它自己的拉普拉斯金字塔,之後每個帶被乘以一個大小正比於金字塔級別的平滑加權函數 。最簡單的方法是建立一個二值掩膜圖像,根據此圖像產生一個高斯金字塔,再將拉普拉斯金字塔和高斯掩膜,這兩個帶權金字塔的和產生最終圖像。

        相對於點操作改變了圖像的值域范圍,幾何變換關注於改變圖像的定義域。原先採用的方法是全局參數化2D變換,之後的注意力將轉向基於網格的局部變形等更多通用變形。

        6.1 參數變換

        參數化變換對整幅圖像進行全局變換,其中變換的行為由少量的參數控制,反向卷繞或反向映射的性能優於前向卷繞,主要在於其能夠避免空洞和非整數位置重采樣的問題。而且可以用高質量的濾波器來控制混疊。

        圖像卷繞問題可形式化為給定一個從目標像素x'到原像素x的映射來重采樣一副原圖像。類似的反向法應用場合有光流法預測光流以及矯正透鏡的徑向畸變。

        重采樣過程的插值濾波器有,二次插值,三次插值,窗插值,二次插值追求速度,三次插值和窗插值追求視覺品質。

        MIP映射是一種紋理映射的快速預濾波圖像工具。   

        MIP圖是標準的圖像金字塔,每層用一個高質量的濾波器濾波而不是低質量的近似,重采樣時,需要預估重采樣率r。

        橢圓帶權平均濾波器(EWA),各向異性濾波,多通變換。

        有向二位濾波和重采樣操作可以用一系列一維重采樣和剪切變換來近似,使用一系列一維變換的優點是它們比大的,不可分離的二位濾波核更有效。

        6.2 基於網格扭曲

            為了獲得更自由的局部變形,產生了網格卷繞。稀疏控制點,稠密集,有向直線分割,位移場的確定。

        6.3 應用:基於特徵的形態學

            卷繞常用於改變單幅圖像的外觀以形成動畫,也可用於多幅圖像的融合以產生強大的變形效果,在兩幅圖像之間進行簡單的漸隱漸顯會導致鬼影,但採用圖像卷繞建立了良好的對應關系,相應的特徵便會對齊。

        用一些優化准則明確表達想要變換的目標,再找到或推斷出這個准則的解決辦法。正則化和變分法,構建一個描述解特性的連續全局能量函數,然後用稀疏線性系統或相關迭代方法找到最小能量解,貝葉斯統計學對產生輸入圖像的有雜訊的測量過程和關於解空間的先驗假設進行建模,通常用馬爾科夫隨機場進行編碼。常見示例有散列數據的表面插值,圖像去噪和缺失區域恢復,將圖像分為前景和背景區域。

      7.1 正則化

        正則化理論試圖用模型來擬合嚴重欠約束解空間的數據。即用一個平滑的表面穿過或是靠近一個測量數據點集合的問題。這樣的問題是病態的和不適定的。這樣由采樣數據點d(xi,yi)恢復完整圖像f(x,y)的問題被稱為逆問題。

        為了定義平滑解,常在解空間上定義一個范數,對於一維函數,函數一階導數的平方進行積分,或對函數二階導數的平方進行積分,這種能量度量是泛函的樣例,是將函數映射到標量值的運算元,這種方法被稱為變分法,用於度量函數的變化(非平滑性)。

        7.2 馬爾科夫隨機場

        7.3 應用:圖像復原

㈧ 四道圖像圖像演算法題目

取X=0時,在Y軸上畫點1。
取Y=0時,在X軸上畫點2。
畫直線通過兩點。
你畫的X=0時,Y是幾?自己數手指頭去。

㈨ 計算機視覺演算法工程師筆試主要什麼內容

你好,領學網為你解答:
計算機視覺部分:
1、考察特徵點匹配演算法,輸入兩幅圖像中的特徵點對,輸出匹配的特徵點對,(128維描述子)距離計算函數已給出無需考慮復雜度。編寫偽代碼,分析演算法復雜度;
2、考察圖像旋轉。左邊圖像時旋轉一定角度後的圖像(有黑邊),右邊為正常圖像。已知兩幅圖像都為WxH,以及左圖像與四邊的切點A1A2A3A4,設計旋轉演算法使左圖像變換矯正成右圖像,編寫偽代碼,分析演算法復雜度及優缺點;
3、主要考察雙目視覺中的標定知識。給出了雙目視覺的成像原理圖及相關定理和表達。第一小題,需要證明x'Fx=0 x'x為左右圖像中的匹配點對,並要求給出F矩陣的秩;第二小題要求推導出最少可由多少對左右圖像中匹配點可以推導出F矩陣;
4、要求寫出圖像處理和計算機視覺在無人飛行器中的3個重要應用。給出理由和解決方案並分析。
圖像處理部分:
1、主要考察一維中值濾波,退化為區間濾波 編寫偽代碼,分析演算法復雜度;
2、主要考察二維中值濾波,編寫偽代碼,分析演算法復雜度;
3、如何去除脈沖雜訊,圖像中有大量隨機產生的255和0雜訊;
4、考察加權中值濾波公式推導以及一維加權中值濾波
控制部分:
對象舉例均為四旋翼無人飛行器,各題目要求設計控制器,給出控制率,還有觀測方案設計等等;有一題比較簡單就是說明PID的各部分含義以及如何調節。
希望幫到你!

閱讀全文

與圖像與演算法應用題相關的資料

熱點內容
python最常用模塊 瀏覽:182
溫州直播系統源碼 瀏覽:110
程序員在上海買房 瀏覽:382
生活解壓游戲機 瀏覽:907
季羨林pdf 瀏覽:716
php支付寶介面下載 瀏覽:814
ipad怎麼把app資源庫關了 瀏覽:301
量柱比前一天多源碼 瀏覽:416
電子書app怎麼上傳 瀏覽:66
國家反詐中心app注冊怎麼開啟 瀏覽:804
全波差分傅里葉演算法窗長 瀏覽:41
程序員如何講自己做過的項目 瀏覽:7
程序員要看的書頸椎 瀏覽:946
php文章cms 瀏覽:553
CSS權威指南第三版PDF 瀏覽:496
android怎麼搭建框架 瀏覽:184
正宗溯源碼大燕條一克一般多少錢 瀏覽:917
電腦感染exe文件夾 瀏覽:916
wpsppt怎麼轉pdf格式 瀏覽:88
騰訊文檔在線編輯怎麼添加密碼 瀏覽:880