1. 人臉識別的發展歷史是怎樣的
人臉識別是一個被廣泛研究著的熱門問題,大量的研究論文層出不窮,在一定程度上有泛濫成「災」之嫌。為了更好地對人臉識別研究的歷史和現狀進行介紹,本文將AFR的研究歷史按照研究內容、技術方法等方面的特點大體劃分為三個時間階段,如表1所示。該表格概括了人臉識別研究的發展簡史及其每個歷史階段代表性的研究工作及其技術特點。下面對三個階段的研究進展情況作簡單介紹:
第一階段(1964年~1990年)
這一階段人臉識別通常只是作為一個一般性的模式識別問題來研究,所採用的主要技術方案是基於人臉幾何結構特徵(Geometricfeature based)的方法。這集中體現在人們對於剪影(Profile)的研究上,人們對面部剪影曲線的結構特徵提取與分析方面進行了大量研究。人工神經網路也一度曾經被研究人員用於人臉識別問題中。較早從事AFR研究的研究人員除了布萊索(Bledsoe)外還有戈登斯泰因(Goldstein)、哈蒙(Harmon)以及金出武雄(Kanade Takeo)等。金出武雄於1973年在京都大學完成了第一篇AFR方面的博士論文,直到現在,作為卡內基-梅隆大學(CMU)機器人研究院的一名教授,仍然是人臉識別領域的活躍人物之一。他所在的研究組也是人臉識別領域的一支重要力量。總體而言,這一階段是人臉識別研究的初級階段,非常重要的成果不是很多,也基本沒有獲得實際應用。
第二階段(1991年~1997年)
這一階段盡管時間相對短暫,但卻是人臉識別研究的高潮期,可謂碩果累累:不但誕生了若干代表性的人臉識別演算法,美國軍方還組織了著名的FERET人臉識別演算法測試,並出現了若干商業化運作的人臉識別系統,比如最為著名的Visionics(現為Identix)的FaceIt系統。
美國麻省理工學院(MIT)媒體實驗室的特克(Turk)和潘特蘭德(Pentland)提出的「特徵臉」方法無疑是這一時期內最負盛名的人臉識別方法。其後的很多人臉識別技術都或多或少與特徵臉有關系,現在特徵臉已經與歸一化的協相關量(NormalizedCorrelation)方法一道成為人臉識別的性能測試基準演算法。
這一時期的另一個重要工作是麻省理工學院人工智慧實驗室的布魯內里(Brunelli)和波基奧(Poggio)於1992年左右做的一個對比實驗,他們對比了基於結構特徵的方法與基於模板匹配的方法的識別性能,並給出了一個比較確定的結論:模板匹配的方法優於基於特徵的方法。這一導向性的結論與特徵臉共同作用,基本中止了純粹的基於結構特徵的人臉識別方法研究,並在很大程度上促進了基於表觀(Appearance-based)的線性子空間建模和基於統計模式識別技術的人臉識別方法的發展,使其逐漸成為主流的人臉識別技術。
貝爾胡米爾(Belhumeur)等提出的Fisherface人臉識別方法是這一時期的另一重要成果。該方法首先採用主成分分析(PrincipalComponent Analysis,PCA,亦即特徵臉)對圖像表觀特徵進行降維。在此基礎上,採用線性判別分析(LinearDiscriminant Analysis, LDA)的方法變換降維後的主成分以期獲得「盡量大的類間散度和盡量小的類內散度」。該方法目前仍然是主流的人臉識別方法之一,產生了很多不同的變種,比如零空間法、子空間判別模型、增強判別模型、直接的LDA判別方法以及近期的一些基於核學習的改進策略。
麻省理工學院的馬哈丹(Moghaddam)則在特徵臉的基礎上,提出了基於雙子空間進行貝葉斯概率估計的人臉識別方法。該方法通過「作差法」,將兩幅人臉圖像對的相似度計算問題轉換為一個兩類(類內差和類間差)分類問題,類內差和類間差數據都要首先通過主成分分析(PCA)技術進行降維,計算兩個類別的類條件概率密度,最後通過貝葉斯決策(最大似然或者最大後驗概率)的方法來進行人臉識別。
人臉識別中的另一種重要方法——彈性圖匹配技術(Elastic GraphMatching,EGM) 也是在這一階段提出的。其基本思想是用一個屬性圖來描述人臉:屬性圖的頂點代表面部關鍵特徵點,其屬性為相應特徵點處的多解析度、多方向局部特徵——Gabor變換[12]特徵,稱為Jet;邊的屬性則為不同特徵點之間的幾何關系。對任意輸入人臉圖像,彈性圖匹配通過一種優化搜索策略來定位預先定義的若乾麵部關鍵特徵點,同時提取它們的Jet特徵,得到輸入圖像的屬性圖。最後通過計算其與已知人臉屬性圖的相似度來完成識別過程。該方法的優點是既保留了面部的全局結構特徵,也對人臉的關鍵局部特徵進行了建模。近來還出現了一些對該方法的擴展。
局部特徵分析技術是由洛克菲勒大學(RockefellerUniversity)的艾提克(Atick)等人提出的。LFA在本質上是一種基於統計的低維對象描述方法,與只能提取全局特徵而且不能保留局部拓撲結構的PCA相比,LFA在全局PCA描述的基礎上提取的特徵是局部的,並能夠同時保留全局拓撲信息,從而具有更佳的描述和判別能力。LFA技術已商業化為著名的FaceIt系統,因此後期沒有發表新的學術進展。
由美國國防部反毒品技術發展計劃辦公室資助的FERET項目無疑是該階段內的一個至關重要的事件。FERET項目的目標是要開發能夠為安全、情報和執法部門使用的AFR技術。該項目包括三部分內容:資助若干項人臉識別研究、創建FERET人臉圖像資料庫、組織FERET人臉識別性能評測。該項目分別於1994年,1995年和1996年組織了3次人臉識別評測,幾種最知名的人臉識別演算法都參加了測試,極大地促進了這些演算法的改進和實用化。該測試的另一個重要貢獻是給出了人臉識別的進一步發展方向:光照、姿態等非理想採集條件下的人臉識別問題逐漸成為熱點的研究方向。
柔性模型(Flexible Models)——包括主動形狀模型(ASM)和主動表觀模型(AAM)是這一時期內在人臉建模方面的一個重要貢獻。ASM/AAM將人臉描述為2D形狀和紋理兩個分離的部分,分別用統計的方法進行建模(PCA),然後再進一步通過PCA將二者融合起來對人臉進行統計建模。柔性模型具有良好的人臉合成能力,可以採用基於合成的圖像分析技術來對人臉圖像進行特徵提取與建模。柔性模型目前已被廣泛用於人臉特徵對准(FaceAlignment)和識別中,並出現了很多的改進模型。
總體而言,這一階段的人臉識別技術發展非常迅速,所提出的演算法在較理想圖像採集條件、對象配合、中小規模正面人臉資料庫上達到了非常好的性能,也因此出現了若干知名的人臉識別商業公司。從技術方案上看, 2D人臉圖像線性子空間判別分析、統計表觀模型、統計模式識別方法是這一階段內的主流技術。
第三階段(1998年~現在)
FERET』96人臉識別演算法評估表明:主流的人臉識別技術對光照、姿態等由於非理想採集條件或者對象不配合造成的變化魯棒性比較差。因此,光照、姿態問題逐漸成為研究熱點。與此同時,人臉識別的商業系統進一步發展。為此,美國軍方在FERET測試的基礎上分別於2000年和2002年組織了兩次商業系統評測。
基奧蓋蒂斯(Georghiades)等人提出的基於光照錐 (Illumination Cones) 模型的多姿態、多光照條件人臉識別方法是這一時期的重要成果之一,他們證明了一個重要結論:同一人臉在同一視角、不同光照條件下的所有圖像在圖像空間中形成一個凸錐——即光照錐。為了能夠從少量未知光照條件的人臉圖像中計算光照錐,他們還對傳統的光度立體視覺方法進行了擴展,能夠在朗博模型、凸表面和遠點光源假設條件下,根據未知光照條件的7幅同一視點圖像恢復物體的3D形狀和表面點的表面反射系數(傳統光度立體視覺能夠根據給定的3幅已知光照條件的圖像恢復物體表面的法向量方向),從而可以容易地合成該視角下任意光照條件的圖像,完成光照錐的計算。識別則通過計算輸入圖像到每個光照錐的距離來完成。
以支持向量機為代表的統計學習理論也在這一時期內被應用到了人臉識別與確認中來。支持向量機是一個兩類分類器,而人臉識別則是一個多類問題。通常有三種策略解決這個問題,即:類內差/類間差法、一對多法(one-to-rest)和一對一法(one-to-one)。
布蘭茲(Blanz)和維特(Vetter)等提出的基於3D變形(3D Morphable Model)模型的多姿態、多光照條件人臉圖像分析與識別方法是這一階段內一項開創性的工作。該方法在本質上屬於基於合成的分析技術,其主要貢獻在於它在3D形狀和紋理統計變形模型(類似於2D時候的AAM)的基礎上,同時還採用圖形學模擬的方法對圖像採集過程的透視投影和光照模型參數進行建模,從而可以使得人臉形狀和紋理等人臉內部屬性與攝像機配置、光照情況等外部參數完全分開,更加有利於人臉圖像的分析與識別。Blanz的實驗表明,該方法在CMU-PIE(多姿態、光照和表情)人臉庫和FERET多姿態人臉庫上都達到了相當高的識別率,證明了該方法的有效性。
2001年的國際計算機視覺大會(ICCV)上,康柏研究院的研究員維奧拉(Viola)和瓊斯(Jones)展示了他們的一個基於簡單矩形特徵和AdaBoost的實時人臉檢測系統,在CIF格式上檢測准正面人臉的速度達到了每秒15幀以上。該方法的主要貢獻包括:1)用可以快速計算的簡單矩形特徵作為人臉圖像特徵;2)基於AdaBoost將大量弱分類器進行組合形成強分類器的學習方法;3)採用了級聯(Cascade)技術提高檢測速度。目前,基於這種人臉/非人臉學習的策略已經能夠實現准實時的多姿態人臉檢測與跟蹤。這為後端的人臉識別提供了良好的基礎。
沙蘇哈(Shashua)等於2001年提出了一種基於商圖像[13]的人臉圖像識別與繪制技術。該技術是一種基於特定對象類圖像集合學習的繪制技術,能夠根據訓練集合中的少量不同光照的圖像,合成任意輸入人臉圖像在各種光照條件下的合成圖像。基於此,沙蘇哈等還給出了對各種光照條件不變的人臉簽名(Signature)圖像的定義,可以用於光照不變的人臉識別,實驗表明了其有效性。
巴斯里(Basri)和雅各布(Jacobs)則利用球面諧波(Spherical Harmonics)表示光照、用卷積過程描述朗博反射的方法解析地證明了一個重要的結論:由任意遠點光源獲得的所有朗博反射函數的集合形成一個線性子空間。這意味著一個凸的朗博表面物體在各種光照條件下的圖像集合可以用一個低維的線性子空間來近似。這不僅與先前的光照統計建模方法的經驗實驗結果相吻合,更進一步從理論上促進了線性子空間對象識別方法的發展。而且,這使得用凸優化方法來強制光照函數非負成為可能,為光照問題的解決提供了重要思路。
FERET項目之後,涌現了若幹人臉識別商業系統。美國國防部有關部門進一步組織了針對人臉識別商業系統的評測FRVT,至今已經舉辦了兩次:FRVT2000和FRVT2002。這兩次測試一方面對知名的人臉識別系統進行了性能比較,例如FRVT2002測試就表明Cognitec, Identix和Eyematic三個商業產品遙遙領先於其他系統,而它們之間的差別不大。另一方面則全面總結了人臉識別技術發展的現狀:較理想條件下(正面簽證照),針對37437人121,589 幅圖像的人臉識別(Identification)最高首選識別率為73%,人臉驗證(Verification)的等錯誤率(EER[14])大約為6%。FRVT測試的另一個重要貢獻是還進一步指出了目前的人臉識別演算法亟待解決的若干問題。例如,FRVT2002測試就表明:目前的人臉識別商業系統的性能仍然對於室內外光照變化、姿態、時間跨度等變化條件非常敏感,大規模人臉庫上的有效識別問題也很嚴重,這些問題都仍然需要進一步的努力。
總體而言,目前非理想成像條件下(尤其是光照和姿態)、對象不配合、大規模人臉資料庫上的人臉識別問題逐漸成為研究的熱點問題。而非線性建模方法、統計學習理論、基於Boosting[15]的學習技術、基於3D模型的人臉建模與識別方法等逐漸成為備受重視的技術發展趨勢。
總而言之, 人臉識別是一項既有科學研究價值,又有廣泛應用前景的研究課題。國際上大量研究人員幾十年的研究取得了豐碩的研究成果,自動人臉識別技術已經在某些限定條件下得到了成功應用。這些成果更加深了我們對於自動人臉識別這個問題的理解,尤其是對其挑戰性的認識。盡管在海量人臉數據比對速度甚至精度方面,現有的自動人臉識別系統可能已經超過了人類,但對於復雜變化條件下的一般人臉識別問題,自動人臉識別系統的魯棒性和准確度還遠不及人類。這種差距產生的本質原因現在還不得而知,畢竟我們對於人類自身的視覺系統的認識還十分膚淺。但從模式識別和計算機視覺等學科的角度判斷,這既可能意味著我們尚未找到對面部信息進行合理采樣的有效感測器(考慮單目攝像機與人類雙眼系統的差別),更可能意味著我們採用了不合適的人臉建模方法(人臉的內部表示問題),還有可能意味著我們並沒有認識到自動人臉識別技術所能夠達到的極限精度。但無論如何,賦予計算設備與人類似的人臉識別能力是眾多該領域研究人員的夢想。相信隨著研究的繼續深入,我們的認識應該能夠更加准確地逼近這些問題的正確答案。
2. 單片機與圖像識別
圖像識別演算法很重要,開發演算法一般用matlab等數學軟體模擬,其語言和C語言差不多。
dsp晶元和單片機差別還是很大的
所謂單片機就是在一塊晶元上集成了CPU、RAM、ROM(EPROM或EEPROM)、時鍾、定時/計數器、多種功能的串列和並行I/O口。除了以上基本功能外,有的還集成有A/D、D/A,甚至無線通信等功能(單片機發展的一個趨勢——片上系統 SOC)。價錢低廉,實現簡單的智能化控制功能。
DSP具有更快的CPU,更大容量的存儲器,內置有波特率發生器和FIFO緩沖器。提供高速、同步串口和標准非同步串口。DSP器件採用改進的哈佛結構,具有獨立的程序和數據空間,允許同時存取程序和數據。內置高速的硬體乘法器,增強的多級流水線,使DSP器件具有高速的數據運算能力。DSP器件比16位單片機單指令執行時間快8~10倍,完成一次乘加運算快16~30倍。DSP器件還提供了高度專業化的指令集,提高了FFT快速傅里葉變換和濾波器的運算速度。功能強大,當然價錢也不菲,所以DSP多用在要求高速數據計算的場合。
進行圖像識別,得用DSP,當然還得搭配其他外圍器件,因為DSP器件只是進行數據的計算和處理。整個系統還需要攝像機、CCD攝像頭或者高速AD做視頻信號的採集,把圖像信號數字化了再處理。數據處理後保存到存儲器或者輸出到顯示器輸出。
一般學圖像識別研究演算法的比較多,開發硬體的比較少。
3. 圖像識別演算法都有哪些
圖像識別,是指利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。一般工業使用中,採用工業相機拍攝圖片,然後再利用軟體根據圖片灰階差做進一步識別處理,圖像識別軟體國外代表的有康耐視等,國內代表的有圖智能等。另外在地理學中指將遙感圖像進行分類的技術。
4. 數字圖像處理的發展趨勢
數字圖像處理(digital image processing)是用計算機對圖像信息進行處理的一門技術,使利用計算機對圖像進行各種處理的技術和方法。
20世紀20年代,圖像處理首次得到應用。20世紀60年代中期,隨電子計算機的發展得到普遍應用。60年代末,圖像處理技術不斷完善,逐漸成為一個新興的學科。利用數字圖像處理主要是為了修改圖形,改善圖像質量,或是從圖像中提起有效信息,還有利用數字圖像處理可以對圖像進行體積壓縮,便於傳輸和保存。數字圖像處理主要研究以下內容:傅立葉變換、小波變換等各種圖像變換;對圖像進行編碼和壓縮;採用各種方法對圖像進行復原和增強;對圖像進行分割、描述和識別等。隨著技術的發展,數字圖像處理主要應用於通訊技術、宇宙探索遙感技術和生物工程等領域。
數字圖像處理因易於實現非線性處理,處理程序和處理參數可變,故是一項通用性強,精度高,處理方法靈活,信息保存、傳送可靠的圖像處理技術。主要用於圖像變換、量測、模式識別、模擬以及圖像產生。廣泛應用在遙感、宇宙觀測、影像醫學、通信、刑偵及多種工業領域。
遙感影像數字圖像處理的內容主要有:①圖像恢復。即校正在成像、記錄、傳輸或回放過程中引入的數據錯誤、雜訊與畸變。包括輻射校正、幾何校正等;②數據壓縮。以改進傳輸、存儲和處理數據效率;③影像增強。突出數據的某些特徵,以提高影像目視質量。包括彩色增強、反差增強、邊緣增強、密度分割、比值運算、去模糊等;④信息提取。從經過增強處理的影像中提取有用的遙感信息。包括採用各種統計分析、集群分析、頻譜分析等自動識別與分類。通常利用專用數字圖像處理系統來實現,且依據目的不同採用不同演算法和技術。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
數字圖像處理概述
數字圖像處理發展概況
數字圖像處理(Digital Image Processing)又稱為計算機圖像處理,它是指將圖像信號轉換成數字信號並利用計算機對其進行處理的過程。數字圖像處理最早出現於20世紀50年代,當時的電子計算機已經發展到一定水平,人們開始利用計算機來處理圖形和圖像信息。數字圖像處理作為一門學科大約形成於20世紀60年代初期。早期的圖像處理的目的是改善圖像的質量,它以人為對象,以改善人的視覺效果為目的。圖像處理中,輸入的是質量低的圖像,輸出的是改善質量後的圖像,常用的圖像處理方法有圖像增強、復原、編碼、壓縮等。首次獲得實際成功應用的是美國噴氣推進實驗室(JPL)。他們對航天探測器徘徊者7號在1964年發回的幾千張月球照片使用了圖像處理技術,如幾何校正、灰度變換、去除雜訊等方法進行處理,並考慮了太陽位置和月球環境的影響,由計算機成功地繪制出月球表面地圖,獲得了巨大的成功。隨後又對探測飛船發回的近十萬張照片進行更為復雜的圖像處理,以致獲得了月球的地形圖、彩色圖及全景鑲嵌圖,獲得了非凡的成果,為人類登月創舉奠定了堅實的基礎,也推動了數字圖像處理這門學科的誕生。在以後的宇航空間技術,如對火星、土星等星球的探測研究中,數字圖像處理技術都發揮了巨大的作用。數字圖像處理取得的另一個巨大成就是在醫學上獲得的成果。1972年英國EMI公司工程師Housfield發明了用於頭顱診斷的X射線計算機斷層攝影裝置,也就是我們通常所說的CT(Computer Tomograph)。CT的基本方法是根據人的頭部截面的投影,經計算機處理來重建截面圖像,稱為圖像重建。1975年EMI公司又成功研製出全身用的CT裝置,獲得了人體各個部位鮮明清晰的斷層圖像。1979年,這項無損傷診斷技術獲得了諾貝爾獎,說明它對人類作出了劃時代的貢獻。與此同時,圖像處理技術在許多應用領域受到廣泛重視並取得了重大的開拓性成就,屬於這些領域的有航空航天、生物醫學工程、工業檢測、機器人視覺、公安司法、軍事制導、文化藝術等,使圖像處理成為一門引人注目、前景遠大的新型學科。隨著圖像處理技術的深入發展,從70年代中期開始,隨著計算機技術和人工智慧、思維科學研究的迅速發展,數字圖像處理向更高、更深層次發展。人們已開始研究如何用計算機系統解釋圖像,實現類似人類視覺系統理解外部世界,這被稱為圖像理解或計算機視覺。很多國家,特別是發達國家投入更多的人力、物力到這項研究,取得了不少重要的研究成果。其中代表性的成果是70年代末MIT的Marr提出的視覺計算理論,這個理論成為計算機視覺領域其後十多年的主導思想。圖像理解雖然在理論方法研究上已取得不小的進展,但它本身是一個比較難的研究領域,存在不少困難,因人類本身對自己的視覺過程還了解甚少,因此計算機視覺是一個有待人們進一步探索的新領域。
數字圖像處理主要研究的內容
數字圖像處理主要研究的內容有以下幾個方面: 1) 圖像變換由於圖像陣列很大,直接在空間域中進行處理,涉及計算量很大。因此,往往採用各種圖像變換的方法,如傅立葉變換、沃爾什變換、離散餘弦變換等間接處理技術,將空間域的處理轉換為變換域處理,不僅可減少計算量,而且可獲得更有效的處理(如傅立葉變換可在頻域中進行數字濾波處理)。目前新興研究的小波變換在時域和頻域中都具有良好的局部化特性,它在圖像處理中也有著廣泛而有效的應用。 2) 圖像編碼壓縮圖像編碼壓縮技術可減少描述圖像的數據量(即比特數),以便節省圖像傳輸、處理時間和減少所佔用的存儲器容量。壓縮可以在不失真的前提下獲得,也可以在允許的失真條件下進行。編碼是壓縮技術中最重要的方法,它在圖像處理技術中是發展最早且比較成熟的技術。 3) 圖像增強和復原圖像增強和復原的目的是為了提高圖像的質量,如去除雜訊,提高圖像的清晰度等。圖像增強不考慮圖像降質的原因,突出圖像中所感興趣的部分。如強化圖像高頻分量,可使圖像中物體輪廓清晰,細節明顯;如強化低頻分量可減少圖像中雜訊影響。圖像復原要求對圖像降質的原因有一定的了解,一般講應根據降質過程建立"降質模型",再採用某種濾波方法,恢復或重建原來的圖像。 4) 圖像分割圖像分割是數字圖像處理中的關鍵技術之一。圖像分割是將圖像中有意義的特徵部分提取出來,其有意義的特徵有圖像中的邊緣、區域等,這是進一步進行圖像識別、分析和理解的基礎。雖然目前已研究出不少邊緣提取、區域分割的方法,但還沒有一種普遍適用於各種圖像的有效方法。因此,對圖像分割的研究還在不斷深入之中,是目前圖像處理中研究的熱點之一。 5) 圖像描述圖像描述是圖像識別和理解的必要前提。作為最簡單的二值圖像可採用其幾何特性描述物體的特性,一般圖像的描述方法採用二維形狀描述,它有邊界描述和區域描述兩類方法。對於特殊的紋理圖像可採用二維紋理特徵描述。隨著圖像處理研究的深入發展,已經開始進行三維物體描述的研究,提出了體積描述、表面描述、廣義圓柱體描述等方法。 6) 圖像分類(識別)圖像分類(識別)屬於模式識別的范疇,其主要內容是圖像經過某些預處理(增強、復原、壓縮)後,進行圖像分割和特徵提取,從而進行判決分類。圖像分類常採用經典的模式識別方法,有統計模式分類和句法(結構)模式分類,近年來新發展起來的模糊模式識別和人工神經網路模式分類在圖像識別中也越來越受到重視。
數字圖像處理的基本特點
(1)目前,數字圖像處理的信息大多是二維信息,處理信息量很大。如一幅256×256低解析度黑白圖像,要求約64kbit的數據量;對高解析度彩色512×512圖像,則要求768kbit數據量;如果要處理30幀/秒的電視圖像序列,則每秒要求500kbit~22.5Mbit數據量。因此對計算機的計算速度、存儲容量等要求較高。(2)數字圖像處理佔用的頻帶較寬。與語言信息相比,佔用的頻帶要大幾個數量級。如電視圖像的帶寬約5.6MHz,而語音帶寬僅為4kHz左右。所以在成像、傳輸、存儲、處理、顯示等各個環節的實現上,技術難度較大,成本亦高,這就對頻帶壓縮技術提出了更高的要求。(3)數字圖像中各個像素是不獨立的,其相關性大。在圖像畫面上,經常有很多像素有相同或接近的灰度。就電視畫面而言,同一行中相鄰兩個像素或相鄰兩行間的像素,其相關系數可達0.9以上,而相鄰兩幀之間的相關性比幀內相關性一般說還要大些。因此,圖像處理中信息壓縮的潛力很大。(4)由於圖像是三維景物的二維投影,一幅圖象本身不具備復現三維景物的全部幾何信息的能力,很顯然三維景物背後部分信息在二維圖像畫面上是反映不出來的。因此,要分析和理解三維景物必須作合適的假定或附加新的測量,例如雙目圖像或多視點圖像。在理解三維景物時需要知識導引,這也是人工智慧中正在致力解決的知識工程問題。(5)數字圖像處理後的圖像一般是給人觀察和評價的,因此受人的因素影響較大。由於人的視覺系統很復雜,受環境條件、視覺性能、人的情緒愛好以及知識狀況影響很大,作為圖像質量的評價還有待進一步深入的研究。另一方面,計算機視覺是模仿人的視覺,人的感知機理必然影響著計算機視覺的研究。例如,什麼是感知的初始基元,基元是如何組成的,局部與全局感知的關系,優先敏感的結構、屬性和時間特徵等,這些都是心理學和神經心理學正在著力研究的課題。
數字圖像處理的優點
1. 再現性好數字圖像處理與模擬圖像處理的根本不同在於,它不會因圖像的存儲、傳輸或復制等一系列變換操作而導致圖像質量的退化。只要圖像在數字化時准確地表現了原稿,則數字圖像處理過程始終能保持圖像的再現。 2.處理精度高按目前的技術,幾乎可將一幅模擬圖像數字化為任意大小的二維數組,這主要取決於圖像數字化設備的能力。現代掃描儀可以把每個像素的灰度等級量化為16位甚至更高,這意味著圖像的數字化精度可以達到滿足任一應用需求。對計算機而言,不論數組大小,也不論每個像素的位數多少,其處理程序幾乎是一樣的。換言之,從原理上講不論圖像的精度有多高,處理總是能實現的,只要在處理時改變程序中的數組參數就可以了。回想一下圖像的模擬處理,為了要把處理精度提高一個數量級,就要大幅度地改進處理裝置,這在經濟上是極不合算的。 3.適用面寬圖像可以來自多種信息源,它們可以是可見光圖像,也可以是不可見的波譜圖像(例如X射線圖像、射線圖像、超聲波圖像或紅外圖像等)。從圖像反映的客觀實體尺度看,可以小到電子顯微鏡圖像,大到航空照片、遙感圖像甚至天文望遠鏡圖像。這些來自不同信息源的圖像只要被變換為數字編碼形式後,均是用二維數組表示的灰度圖像(彩色圖像也是由灰度圖像組合成的,例如RGB圖像由紅、綠、藍三個灰度圖像組合而成)組合而成,因而均可用計算機來處理。即只要針對不同的圖像信息源,採取相應的圖像信息採集措施,圖像的數字處理方法適用於任何一種圖像。 4.靈活性高圖像處理大體上可分為圖像的像質改善、圖像分析和圖像重建三大部分,每一部分均包含豐富的內容。由於圖像的光學處理從原理上講只能進行線性運算,這極大地限制了光學圖像處理能實現的目標。而數字圖像處理不僅能完成線性運算,而且能實現非線性處理,即凡是可以用數學公式或邏輯關系來表達的一切運算均可用數字圖像處理實現。
數字圖像處理的應用
圖像是人類獲取和交換信息的主要來源,因此,圖像處理的應用領域必然涉及到人類生活和工作的方方面面。隨著人類活動范圍的不斷擴大,圖像處理的應用領域也將隨之不斷擴大。 1)航天和航空技術方面的應用數字圖像處理技術在航天和航空技術方面的應用,除了上面介紹的JPL對月球、火星照片的處理之外,另一方面的應用是在飛機遙感和衛星遙感技術中。許多國家每天派出很多偵察飛機對地球上有興趣的地區進行大量的空中攝影。對由此得來的照片進行處理分析,以前需要僱用幾千人,而現在改用配備有高級計算機的圖像處理系統來判讀分析,既節省人力,又加快了速度,還可以從照片中提取人工所不能發現的大量有用情報。從60年代末以來,美國及一些國際組織發射了資源遙感衛星(如LANDSAT系列)和天空實驗室(如SKYLAB),由於成像條件受飛行器位置、姿態、環境條件等影響,圖像質量總不是很高。因此,以如此昂貴的代價進行簡單直觀的判讀來獲取圖像是不合算的,而必須採用數字圖像處理技術。如LANDSAT系列陸地衛星,採用多波段掃描器(MSS),在900km高空對地球每一個地區以18天為一周期進行掃描成像,其圖像解析度大致相當於地面上十幾米或100米左右(如1983年發射的LANDSAT-4,解析度為30m)。這些圖像在空中先處理(數字化,編碼)成數字信號存入磁帶中,在衛星經過地面站上空時,再高速傳送下來,然後由處理中心分析判讀。這些圖像無論是在成像、存儲、傳輸過程中,還是在判讀分析中,都必須採用很多數字圖像處理方法。現在世界各國都在利用陸地衛星所獲取的圖像進行資源調查(如森林調查、海洋泥沙和漁業調查、水資源調查等),災害檢測(如病蟲害檢測、水火檢測、環境污染檢測等),資源勘察(如石油勘查、礦產量探測、大型工程地理位置勘探分析等),農業規劃(如土壤營養、水份和農作物生長、產量的估算等),城市規劃(如地質結構、水源及環境分析等)。我國也陸續開展了以上諸方面的一些實際應用,並獲得了良好的效果。在氣象預報和對太空其它星球研究方面,數字圖像處理技術也發揮了相當大的作用。 2)生物醫學工程方面的應用數字圖像處理在生物醫學工程方面的應用十分廣泛,而且很有成效。除了上面介紹的CT技術之外,還有一類是對醫用顯微圖像的處理分析,如紅細胞、白細胞分類,染色體分析,癌細胞識別等。此外,在X光肺部圖像增晰、超聲波圖像處理、心電圖分析、立體定向放射治療等醫學診斷方面都廣泛地應用圖像處理技術。 3)通信工程方面的應用當前通信的主要發展方向是聲音、文字、圖像和數據結合的多媒體通信。具體地講是將電話、電視和計算機以三網合一的方式在數字通信網上傳輸。其中以圖像通信最為復雜和困難,因圖像的數據量十分巨大,如傳送彩色電視信號的速率達100Mbit/s以上。要將這樣高速率的數據實時傳送出去,必須採用編碼技術來壓縮信息的比特量。在一定意義上講,編碼壓縮是這些技術成敗的關鍵。除了已應用較廣泛的熵編碼、DPCM編碼、變換編碼外,目前國內外正在大力開發研究新的編碼方法,如分行編碼、自適應網路編碼、小波變換圖像壓縮編碼等。 4)工業和工程方面的應用在工業和工程領域中圖像處理技術有著廣泛的應用,如自動裝配線中檢測零件的質量、並對零件進行分類,印刷電路板疵病檢查,彈性力學照片的應力分析,流體力學圖片的阻力和升力分析,郵政信件的自動分揀,在一些有毒、放射性環境內識別工件及物體的形狀和排列狀態,先進的設計和製造技術中採用工業視覺等等。其中值得一提的是研製具備視覺、聽覺和觸覺功能的智能機器人,將會給工農業生產帶來新的激勵,目前已在工業生產中的噴漆、焊接、裝配中得到有效的利用。 5)軍事公安方面的應用在軍事方面圖像處理和識別主要用於導彈的精確末制導,各種偵察照片的判讀,具有圖像傳輸、存儲和顯示的軍事自動化指揮系統,飛機、坦克和軍艦模擬訓練系統等;公安業務圖片的判讀分析,指紋識別,人臉鑒別,不完整圖片的復原,以及交通監控、事故分析等。目前已投入運行的高速公路不停車自動收費系統中的車輛和車牌的自動識別都是圖像處理技術成功應用的例子。 6)文化藝術方面的應用目前這類應用有電視畫面的數字編輯,動畫的製作,電子圖像游戲,紡織工藝品設計,服裝設計與製作,發型設計,文物資料照片的復制和修復,運動員動作分析和評分等等,現在已逐漸形成一門新的藝術--計算機美術。
5. 機器視覺新手應該如何學習
機器視覺新手的學習方法:
1、機器視覺涵蓋的方向非常廣泛,學習機器視覺之前應該明白自己以後想從事的方向,然後針對不同崗位對崗位職責的要求進行學習補充。
2、了解機器視覺的基本概念,因為從大范圍大環境下去了解會非常利於對其他零散知識的整合,也更容易接納。
3、確定好自己在機器視覺領域的從業方向後,可以分為硬體或軟體方向等確認學習目標。
4、知道自己學習的方向後需要了解如何使用操作。
機器視覺是人工智慧正在快速發展的一個分支。簡單說來,機器視覺
器視覺系統就是利用機器代替人眼來作各種測量和判斷。它是計算機學科的一個重要分支,它綜合了光學、機械、電子、計算機軟硬體等方面的技術,涉及到計算機、圖像處理、模式識別、人工智慧、信號處理、光機電一體化等多個領域。圖像處理和模式識別等技術的快速發展,也大大地推動了機器視覺的發展一個完整的機器視覺系統的主要工作過程如下:1、工件定位檢測器探測到物體已經運動至接近攝像系統的視野中心,向圖像採集部分發送觸發脈沖。2、圖像採集部分按照事先設定的程序和延時,分別向攝像機和照明系統發出啟動脈沖。3、攝像機停止目前的掃描,重新開始新的一幀掃描,或者攝像機在啟動脈沖來到之前處於等待狀態,啟動脈沖到來後啟動一幀掃描。4、攝像機開始新的一幀掃描之前打開曝光機構,曝光時間可以事先設定。5、另一個啟動脈沖打開燈光照明,燈光的開啟時間應該與攝像機的曝光時間匹配。6、攝像機曝光後,正式開始一幀圖像的掃描和輸出。7、圖像採集部分接收模擬視頻信號通過A/D將其數字化,或者是直接接收攝像機數字化後的數字視頻數據。8、圖像採集部分將數字圖像存放在處理器或計算機的內存中。9、處理器對圖像進行處理、分析、識別,獲得測量結果或邏輯控制值。10、處理結果控制流水線的動作、進行定位、糾正運動的誤差等。 從上述的工作流程可以看出,機器視覺是一種比較復雜的系統。因為大多數系統監控對象都是運動物體,系統與運動物體的匹配和協調動作尤為重要,所以給系統各部分的動作時間和處理速度帶來了嚴格的要求。在某些應用領域,例如機器人、飛行物體導制等,對整個系統或者系統的一部分的重量、體積和功耗都會有嚴格的要求。(良) 清楚了以上機器視覺的原理和過程之後,我建議: 1)人類和動物視覺系統的原理 2)攝像機技術與原理 3)圖像識別和處理技術 4)計算機技術5)人工智慧
6. 圖像識別技術何時可以發展到比較完善的程度!
這主要取決於識別軟體的發展速度 硬體速度是發展極快的 但是識別程序的能力有限 所以沒法估計 因為軟體是人編的 什麼時候能在演算法上有突破這是個未知數 不像硬體的發展是可以預測的
7. 圖像識別應用方向
醫學方面、安全監控方面、原件缺陷檢測、人流統計、車牌識別、機器人運行定位等等。圖像識別技術的研究目標是根據觀測到的圖像,對其中的物體分辨其類別,做出有意義的判斷。即利用現代信息處理與計算技術來模擬和完成人類的認識,理解過程。一般而言,一個圖像識別系統主要由三個部分組成,如圖l所示,分別是圖像分割,圖像特徵提取以及分類器的識別分類。目前,在圖像識別的發展中,主要有三種識別方法:統計模式識別、結構模式識別、模糊模式識別。
江蘇視圖科技目前能做到相同圖,相似圖搜索,公司是國內一流圖像識別演算法提供商。
8. 圖像識別演算法有幾種
從模式特徵選擇及判別決策方法的不同可將圖像模式識別方法大致歸納為兩類:統計模式(決策理論)識別方法和句法(結構)模式識別方法。此外,近些年隨著對模式識別技術研究的進一步深入,公司模糊模式識別方法和神經網路模式識別方法也開始得到廣泛的應用。江蘇視圖科技演算法提供商。