人臉檢測演算法綜述_人臉識別的識別演算法

❶ 人臉識別的識別演算法

人臉識別的基本方法

人臉識別的方法很多，以下介紹一些主要的人臉識別方法。

(1)幾何特徵的人臉識別方法

幾何特徵可以是眼、鼻、嘴等的形狀和它們之間的幾何關系(如相互之間的距離)。這些演算法識別速度快，需要的內存小，但識別率較低。

(2)基於特徵臉(PCA)的人臉識別方法

特徵臉方法是基於KL變換的人臉識別方法，KL變換是圖像壓縮的一種最優正交變換。高維的圖像空間經過KL變換後得到一組新的正交基，保留其中重要的正交基，由這些基可以張成低維線性空間。如果假設人臉在這些低維線性空間的投影具有可分性，就可以將這些投影用作識別的特徵矢量，這就是特徵臉方法的基本思想。這些方法需要較多的訓練樣本，而且完全是基於圖像灰度的統計特性的。目前有一些改進型的特徵臉方法。

(3)神經網路的人臉識別方法

神經網路的輸入可以是降低解析度的人臉圖像、局部區域的自相關函數、局部紋理的二階矩等。這類方法同樣需要較多的樣本進行訓練，而在許多應用中，樣本數量是很有限的。

(4)彈性圖匹配的人臉識別方法

彈性圖匹配法在二維的空間中定義了一種對於通常的人臉變形具有一定的不變性的距離，並採用屬性拓撲圖來代表人臉，拓撲圖的任一頂點均包含一特徵向量，用來記錄人臉在該頂點位置附近的信息。該方法結合了灰度特性和幾何因素，在比對時可以允許圖像存在彈性形變，在克服表情變化對識別的影響方面收到了較好的效果，同時對於單個人也不再需要多個樣本進行訓練。

(5)線段Hausdorff 距離(LHD) 的人臉識別方法

心理學的研究表明，人類在識別輪廓圖(比如漫畫)的速度和准確度上絲毫不比識別灰度圖差。LHD是基於從人臉灰度圖像中提取出來的線段圖的，它定義的是兩個線段集之間的距離，與眾不同的是，LHD並不建立不同線段集之間線段的一一對應關系，因此它更能適應線段圖之間的微小變化。實驗結果表明，LHD在不同光照條件下和不同姿態情況下都有非常出色的表現，但是它在大表情的情況下識別效果不好。

(6)支持向量機(SVM) 的人臉識別方法

近年來，支持向量機是統計模式識別領域的一個新的熱點，它試圖使得學習機在經驗風險和泛化能力上達到一種妥協，從而提高學習機的性能。支持向量機主要解決的是一個2分類問題，它的基本思想是試圖把一個低維的線性不可分的問題轉化成一個高維的線性可分的問題。通常的實驗結果表明SVM有較好的識別率，但是它需要大量的訓練樣本(每類300個)，這在實際應用中往往是不現實的。而且支持向量機訓練時間長，方法實現復雜，該函數的取法沒有統一的理論。

人臉識別的方法很多，當前的一個研究方向是多方法的融合，以提高識別率。

在人臉識別中，第一類的變化是應該放大而作為區分個體的標準的，而第二類的變化應該消除，因為它們可以代表同一個個體。通常稱第一類變化為類間變化，而稱第二類變化為類內變化。對於人臉，類內變化往往大於類間變化，從而使在受類內變化干擾的情況下利用類間變化區分個體變得異常困難。正是基於上述原因，一直到21 世紀初，國外才開始出現人臉識別的商用，但由於人臉識別演算法非常復雜，只能採用龐大的伺服器，基於強大的計算機平台。

如果可以的話，可以Te一下colorreco，更好的技術解答。

❷ 人臉識別身份系統的工作原理是什麼

❸ 人臉檢測會不會把鼻子檢測成眼睛

不會，可以識別的。

人臉檢測演算法的輸入是一張圖片，輸出是人臉框坐標序列（0個人臉框或1個人臉框或多個人臉框）。一般情況下，輸出的人臉坐標框為一個正朝上的正方形，但也有一些人臉檢測技術輸出的是正朝上的矩形，或者是帶旋轉方向的矩形。

常見的人臉檢測演算法基本是一個「掃描」加「判別」的過程，即演算法在圖像范圍內掃描，再逐個判定候選區域是否是人臉的過程。因此人臉檢測演算法的計算速度會跟圖像尺寸、圖像內容相關。開發過程中，我們可以通過設置「輸入圖像尺寸」、或「最小臉尺寸限制」、或「人臉數量上限」的方式來加速演算法。

人臉配准

「人臉配准（Face Alignment）」是定位出人臉上五官關鍵點坐標的一項技術。

人臉配准演算法的輸入是「一張人臉圖片」加「人臉坐標框」，輸出五官關鍵點的坐標序列。五官關鍵點的數量是預先設定好的一個固定數值，可以根據不同的語義來定義（常見的有5點、68點、90點等等）。

當前效果的較好的一些人臉配准技術，基本通過深度學習框架實現，這些方法都是基於人臉檢測的坐標框，按某種事先設定規則將人臉區域扣取出來，縮放的固定尺寸，然後進行關鍵點位置的計算。

因此，若不計入圖像縮放過程的耗時，人臉配准演算法是可以計算量固定的過程。另外，相對於人臉檢測，或者是後面將提到的人臉提特徵過程，人臉配准演算法的計算耗時都要少很多。

❹ viola jones人臉檢測原理

Viola-jones人臉檢測演算法是一種基於滑動窗口的目標檢測演算法，但它卻克服了滑動窗口檢測帶來的低效問題，可以用於實時人臉檢測，主要歸功於以下三點：

我參考論文[1]實現了Viola Jones中提到的attention cascade檢測框架，此處是 github傳送門。

下面進一步詳細介紹整個檢測原理。

基於滑窗的目標檢測基本原理很簡單，首先構建一個classifier（分類器），以人臉檢測為例，分類器的工作是判斷給定大小的圖像的是否為人臉，用該分類器從左至右從上到下掃描整幅圖像，掃描獲取的部分圖像稱為子窗（文章中子窗大小為24x24像素），當分類器判斷子窗是人臉時，即完成了人臉檢測。

這樣處理有個問題，如果圖像中包含的人臉變大了，此時採用固定大小的子窗就無法進行檢測。通常有兩種解決方法，1. 採用image-pyramid（圖像金字塔），也就是通過resize獲得多種不同大小圖像並堆疊在一起，用固定大小分類器同時對所有圖像進行掃描；2. 採用不同大小的分類器進行掃描。文章中用到的是第二種方法，盡管如此，雖然避免了調整圖像大小帶來的計算開銷，但不同大小的分類器意味著有更多子窗需要進行處理。

如何構建一個足夠快的分類器來對每個子窗進行快速判斷。

分類器的構建有兩種方式，一種是pixel-based（基於像素），另一種是feature-based（基於特徵）。當把神經網路作為圖像分類器時，輸入是圖像的像素值，即基於像素的分類器。用圖像像素作為輸入不包含任何和待分類目標有關的特定信息，往往訓練這種分類器需要大量數據，並且分類過程較慢。基於特徵的分類器就是先針對圖像進行特徵提取（HOG特徵，SIFT特徵等），再利用獲取的特徵進行分類。這種分類器不需要大量訓練數據，且計算量一般會在特徵計算部分，相對較小。

文章採用的是基於特徵的分類器，選取了一種較為簡單的特徵即haar-like特徵。利用矩形個數對可以將haar-like特徵分為三類，分別由兩個，三個，和四個 大小相同 的矩形組成。全部列舉出來可以分為以下(a)(b)(c)(d)(e)五類（注意是五類不是五個，具體有多少個haar-like特徵是由子窗大小決定的）。如下圖所示（文章[1]中的圖）。

當子窗大小給定後，我們可以用五個參數唯一確定一個 haar-like特徵，即特徵種類（a/b/c/d/e），左上角x軸坐標，左上角y軸坐標，矩形的長，矩形的寬。對應的特徵值等於位於白色矩形框中像素值總和減去位於黑色矩形框中的像素值總和。文章中用到的子窗大小為24x24像素，可以計算出來總共有162336個特徵（把在子窗中所有可能位置和可能大小的特徵全部列舉出來）。利用haar-like特徵進行分類只需兩步：

haar-like特徵有兩個優點，第一是它是scale-invariant(不隨圖片大小而改變)的，第二是可以通過積分圖像快速計算。簡單的說下第一點的含義，例如我們用24x24像素的訓練樣本訓練獲取一組haar-like特徵和對應的門限值，當對圖像進行掃描時，子窗大小調整為SxS像素，此時只需將特徵中的矩形大小按同樣比例進行縮放（門限值同樣需要縮放），計算所得的特徵值依然是有效的。
積分圖像是受卷積的微分性質啟發而定義一種數據結構。積分圖像定義：

其中為積分圖像，為原圖像。積分圖像中位置處的像素值等於原圖中位於的左側和上方的所有像素值之和。有了積分圖像我們就可以快速計算haar-like特徵，以特徵（a）為例，如下圖所示。

S1到S6是積分圖像在這六個頂點上的值。該特徵值等於位於A中的像素總和減去位於B中的像素總和，而A中像素總和等於S5+S1-S2-S4，B中像素總和等於S6+S2-S3-S5，並且無論矩形多大，我們總能在固定時間內計算出特徵值（6次索引操作和少量的加法乘法計算）。積分圖像只需計算一次後續可以一直使用，事實上在演算法實現時，我們只需保存樣本的積分圖像，原圖像反而不用保存。

現在找到了一類特徵用於構建分類器，和快速計算該類特徵的方法。分類器是由一組特徵構成的，而不是一個，如何找到一組有效的特徵。

文章列舉了前人的一些特徵選取方法（此處就不列舉了），它們雖然取得了一定的效果，但最終選出來的特徵數量還是太多。文章將adaBoost演算法用於特徵選取（創新點），即每次訓練的弱分類器的過程看做特徵選取的過程，一次從162336個特徵中選取一個特徵（同時還包括了對應的門限值，極性，加權誤差）。

adaboost演算法就不詳細介紹了，它的基本思想是訓練一系列「弱」分類器，組成一個committee（即每個弱分類器都有投票權，但是權重不同，加權誤差越小的弱分類器權重越大）。adaboost採用迭代訓練方式，給定一個t階committee，如何尋找第t+1個弱分類器和對應的權重，以最小化在一定分布下的訓練樣本的加權指數損失。這個優化過程可以轉換為對訓練樣本的分布進行調整（即增大上一輪錯誤判斷的樣本的權重，減小正確判斷的樣本權重），在調整後的樣本分布下尋找最小化加權0-1損失的弱分類器並計算對應的加權0-1損失。

可以利用adaboost找到一組特徵構成分類器，使得該分類器有極高的准確率和召回率（這種分類器勢必會有較大的計算量），這樣會導致圖像中的每一個子窗都享有同等的計算量，掃描一整幅圖會有幾十萬甚至上百萬子窗，總體計算量依然很大。實際上一幅圖像中只有極少可能包含人臉的位置是我們感興趣的，其他不包含人臉的子窗我們希望能夠快速篩除，將更精細的計算用於包含人臉的子窗。

文章引入了attention-cascade的機制（注意力級聯），即訓練多個分類器進行級聯，替代單一的分類器。結構如下圖所示（文章[3]中的圖）。

上圖所示的分類器有三級，上一級的輸出是下一級的輸入，只有預測為正的樣本才能傳遞給下一級，預測為負的樣本直接舍棄。大部分非人臉子窗往往在前幾級分類器就被舍棄，這樣使得掃描每個子窗所需的平均計算量大大減小。

分類器是一級一級訓練之後級聯起來的，訓練分類器時，整個級聯分類器的假負率（fpr_overall）有一個訓練目標（文章[1]中設置為10e-7），同時每一級有一對訓練目標，即假正率和假負率。每級分類器訓練的思想是在假負率極低的情況下（文章[1]中設置為0.005）盡量得到一個較低的假正率（文章中[1]中設置為0.5），即我們保證在正樣本盡可能多的通過該級分類器的情況下盡量篩除更多的負樣本。文章[3]通過一個鬆弛量來調節假正率和假負率。

下一級用到的訓練數據是由所有的正樣本和上一級輸出的假正樣本組成的，這樣訓練的好處是可以讓處於級聯後半部分的分類器「看到」更多負樣本數據，缺點是訓練後期假正樣本很難獲取，訓練時間會比較長。

盡管我們獲取了一個級聯分類器，但依然不能保證對同一幅圖中的一張人臉只會檢測到一次（子窗相對人臉有所便宜或者縮放子窗大小都可能導致重復檢測），如何消除重復檢測，獲得更好的檢測效果。

文章[3]中說的較為簡略，主要是針對檢測框構建並查集，並對並查集中的候選框求平均得出最終的檢測框。

文章[1]中是採用連通分量演算法，計算每種大小檢測框的置信度，根據置信度選取最終結果，但前提是檢測器在圖像中掃描的步進必須是1個像素，處理時間可能會比較長。

只能用於正臉檢測，如果人臉朝屏幕內外或者在屏幕平面上旋轉均有可能失效
在背景較亮，人臉較暗的情況下可能失效。
在有遮擋的情況下大概率失效。

❺ 描述人臉識別的過程

人臉識別是一種依據人的面部特徵，自動進行身份識別的一種生物識別技術，通常我們所說的人臉識別是基於光學人臉圖像的身份識別與驗證的簡稱。

人臉識別利用攝像機或攝像頭採集含有人臉的圖像或視頻流，並自動在圖像中檢測和跟蹤人臉，進而對檢測到的人臉圖像進行一系列的相關應用操作，技術上包括圖像採集、特徵定位、身份的確認和查找等等。

簡單來說，就是從照片中提取人臉中的特徵，比如眉毛高度、嘴角等等，再通過特徵的對比輸出結果。人臉識別的一般流程：

一、人臉採集：

不同的人臉圖像通過攝像鏡頭採集得到，比如靜態圖像、動態圖像、不同位置、不同表情等，當採集對象在設備的拍攝范圍內時，採集設備會自動搜索並拍攝人臉圖像。

人臉採集的主要影響因素：

圖像大小

人臉圖像過小會影響識別效果，人臉圖像過大會影響識別速度，圖像大小反映在實際應用場景就是人臉離攝像頭的距離。

圖像解析度

越低的圖像解析度越難識別，圖像大小綜合圖像解析度，直接影響攝像頭識別距離。

光照環境

過曝或過暗的光照環境都會影響人臉識別效果，可以從攝像頭自帶的功能補光或濾光平衡光照影響，也可以利用演算法模型優化圖像光線。

模糊程度

實際場景主要著力解決運動模糊，人臉相對於攝像頭的移動經常會產生運動模糊。部分攝像頭有抗模糊的功能，在成本有限的情況下，考慮通過演算法模型優化此問題。

遮擋程度

五官無遮擋、臉部邊緣清晰的圖像為最佳，在實際場景中，很多人臉都會被帽子、眼鏡、口罩等遮擋物遮擋，這部分數據需要根據演算法要求決定是否留用訓練。

採集角度

人臉相對於攝像頭角度為正臉最佳，因此演算法模型需訓練包含左右側人臉、上下側人臉的數據

❻ 人臉識別技術小知識有哪些

人臉識別技術是指利用分析比較的計算機技術識別人臉。人臉識別是一項熱門的計算機技術研究領域，其中包括人臉追蹤偵測，自動調整影像放大，夜間紅外偵測，自動調整曝光強度等技術。

人臉識別技術屬於生物特徵識別技術，是對生物體（一般特指人）本身的生物特徵來區分生物體個體。

(1)人臉檢測

面貌檢測是指在動態的場景與復雜的背景中判斷是否存在面像，並分離出這種面像。一般有下列幾種方法：

①參考模板法

首先設計一個或數個標准人臉的模板，然後計算測試採集的樣品與標准模板之間的匹配程度，並通過閾值來判斷是否存在人臉；

②人臉規則法

由於人臉具有一定的結構分布特徵，所謂人臉規則的方法即提取這些特徵生成相應的規則以判斷測試樣品是否包含人臉；

③樣品學習法

這種方法即採用模式識別中人工神經網路的方法，即通過對面像樣品集和非面像樣品集的學習產生分類器；

④膚色模型法

這種方法是依據面貌膚色在色彩空間中分布相對集中的規律來進行檢測。

⑤特徵子臉法

這種方法是將所有面像集合視為一個面像子空間，並基於檢測樣品與其在子空間的投影之間的距離判斷是否存在面像。

值得提出的是，上述5種方法在實際檢測系統中也可綜合採用。

(2)人臉跟蹤

面貌跟蹤是指對被檢測到的面貌進行動態目標跟蹤。具體採用基於模型的方法或基於運動與模型相結合的方法。此外，利用膚色模型跟蹤也不失為一種簡單而有效的手段。

(3)人臉比對

面貌比對是對被檢測到的面貌像進行身份確認或在面像庫中進行目標搜索。這實際上就是說，將采樣到的面像與庫存的面像依次進行比對，並找出最佳的匹配對象。所以，面像的描述決定了面像識別的具體方法與性能。主要採用特徵向量與面紋模板兩種描述方法：

①特徵向量法

該方法是先確定眼虹膜、鼻翼、嘴角等面像五官輪廓的大小、位置、距離等屬性，然後再計算出它們的幾何特徵量，而這些特徵量形成一描述該面像的特徵向量。

②面紋模板法

該方法是在庫中存貯若干標准面像模板或面像器官模板，在進行比對時，將采樣面像所有象素與庫中所有模板採用歸一化相關量度量進行匹配。此外，還有採用模式識別的自相關網路或特徵與模板相結合的方法。

人臉識別技術的核心實際為「局部人體特徵分析」和「圖形/神經識別演算法。」這種演算法是利用人體面部各器官及特徵部位的方法。如對應幾何關系多數據形成識別參數與資料庫中所有的原始參數進行比較、判斷與確認。一般要求判斷時間低於1秒。

識別過程

一般分三步：

(1)首先建立人臉的面像檔案。即用攝像機採集單位人員的人臉的面像文件或取他們的照片形成面像文件，並將這些面像文件生成面紋(Faceprint)編碼貯存起來。

(2)獲取當前的人體面像。即用攝像機捕捉的當前出入人員的面像，或取照片輸入，並將當前的面像文件生成面紋編碼。

(3)用當前的面紋編碼與檔案庫存的比對。即將當前的面像的面紋編碼與檔案庫存中的面紋編碼進行檢索比對。上述的「面紋編碼」方式是根據人臉臉部的本質特徵和開頭來工作的。這種面紋編碼可以抵抗光線、皮膚色調、面部毛發、發型、眼鏡、表情和姿態的變化，具有強大的可靠性，從而使它可以從百萬人中精確地辨認出某個人。人臉的識別過程，利用普通的圖像處理設備就能自動、連續、實時地完成。

技術流程

人臉識別系統主要包括四個組成部分，分別為：人臉圖像採集及檢測、人臉圖像預處理、人臉圖像特徵提取以及匹配與識別。

人臉圖像採集及檢測

人臉圖像採集：不同的人臉圖像都能通過攝像鏡頭採集下來，比如靜態圖像、動態圖像、不同的位置、不同表情等方面都可以得到很好的採集。當用戶在採集設備的拍攝范圍內時，採集設備會自動搜索並拍攝用戶的人臉圖像。

人臉檢測：人臉檢測在實際中主要用於人臉識別的預處理，即在圖像中准確標定出人臉的位置和大小。人臉圖像中包含的模式特徵十分豐富，如直方圖特徵、顏色特徵、模板特徵、結構特徵及Haar特徵等。人臉檢測就是把這其中有用的信息挑出來，並利用這些特徵實現人臉檢測。

主流的人臉檢測方法基於以上特徵採用Adaboost學習演算法，Adaboost演算法是一種用來分類的方法，它把一些比較弱的分類方法合在一起，組合出新的很強的分類方法。

人臉檢測過程中使用Adaboost演算法挑選出一些最能代表人臉的矩形特徵(弱分類器)，按照加權投票的方式將弱分類器構造為一個強分類器，再將訓練得到的若干強分類器串聯組成一個級聯結構的層疊分類器，有效地提高分類器的檢測速度。

人臉圖像預處理

人臉圖像預處理：對於人臉的圖像預處理是基於人臉檢測結果，對圖像進行處理並最終服務於特徵提取的過程。系統獲取的原始圖像由於受到各種條件的限制和隨機干擾，往往不能直接使用，必須在圖像處理的早期階段對它進行灰度校正、雜訊過濾等圖像預處理。對於人臉圖像而言，其預處理過程主要包括人臉圖像的光線補償、灰度變換、直方圖均衡化、歸一化、幾何校正、濾波以及銳化等。

人臉圖像特徵提取

人臉圖像特徵提取：人臉識別系統可使用的特徵通常分為視覺特徵、像素統計特徵、人臉圖像變換系數特徵、人臉圖像代數特徵等。人臉特徵提取就是針對人臉的某些特徵進行的。人臉特徵提取，也稱人臉表徵，它是對人臉進行特徵建模的過程。人臉特徵提取的方法歸納起來分為兩大類：一種是基於知識的表徵方法；另外一種是基於代數特徵或統計學習的表徵方法。

基於知識的表徵方法主要是根據人臉器官的形狀描述以及他們之間的距離特性來獲得有助於人臉分類的特徵數據，其特徵分量通常包括特徵點間的歐氏距離、曲率和角度等。人臉由眼睛、鼻子、嘴、下巴等局部構成，對這些局部和它們之間結構關系的幾何描述，可作為識別人臉的重要特征，這些特徵被稱為幾何特徵。基於知識的人臉表徵主要包括基於幾何特徵的方法和模板匹配法。

人臉圖像匹配與識別

人臉圖像匹配與識別：提取的人臉圖像的特徵數據與資料庫中存儲的特徵模板進行搜索匹配，通過設定一個閾值，當相似度超過這一閾值，則把匹配得到的結果輸出。人臉識別就是將待識別的人臉特徵與已得到的人臉特徵模板進行比較，根據相似程度對人臉的身份信息進行判斷。這一過程又分為兩類：一類是確認，是一對一進行圖像比較的過程，另一類是辨認，是一對多進行圖像匹配對比的過程。

衡量人臉識別的演算法能力：拒識率、誤識率、通過率，准確率。

導航:首頁 > 源碼編譯 > 人臉檢測演算法綜述

人臉檢測演算法綜述

與人臉檢測演算法綜述相關的資料