Ⅰ 什麼是聲紋識別
語音攜帶的信息非常豐富,大家普遍了解的語音識別是指對語音內容的識別技術,即解決了「給定語音到底說了什麼」的問題。
聲紋識別簡單的說就是判斷給定的一句話到底是誰說的技術。早在上世紀40年代末期就有相關研究者開始進行相關技術的探索,主要應用於軍事情報領域。其理論基礎就是「每個人的說話特性都具有其獨特的特徵」,而決定這種獨特特徵的主要因素有:
1、聲腔的差異,其包括咽喉、鼻腔、口腔以及胸腔等,這些欺誑的形狀、尺寸和位置決定了聲腔的差異。因此大家可以感受到,不同的人說話,其聲音的頻率分布是不同的;
2、發聲的操作方式,主要是指唇、口齒、舌頭等部位在發聲時的相互作用。
一般而言,人在逐漸的學習過程中就會慢慢的形成了自己的聲紋特性,正常說話時的聲紋狀態還是相對穩定的。但是聲紋特性仍然具有易變性,因為影響聲紋特性的兩個因素非常容易受身體狀況、年齡、情緒等情況的干擾,從而導致聲紋特性的變化。例如:人隨著年齡的變化聲紋特性也在隨之變化,尤其是小時候和成年後;人在感冒時由於鼻腔堵塞等問題會明顯感覺到聲紋特性的不一致等。當然,人也可以通過刻意的模仿等形成不同的聲紋特性。總而言之,聲紋特徵是類似於虹膜、指紋等一種具有獨特性的生物特徵。
聲紋識別從任務上來說,主要分為聲紋確認技術(1:1)和聲紋識別技術(1:N)兩類。聲紋確認技術回答的是兩句話到底是不是一個人說的問題,而聲紋識別技術回答的則是」給定的一句話屬於樣本庫中誰說的」問題。
Ⅱ 聲紋識別技術原理是什麼
聲紋識別技術原理是利用聲音的獨特性來識別人物的,聲紋識別簡單地說,就是通過聲音進行說話人身份識別的過程。語音信號之所以被形容為「形簡意豐」,是因為聲音包含有內容、身份、情感、年齡及健康狀況等豐富的信息。
人類語言的產生是人體語言中樞與發音器官之間一個復雜的生理物理過程,理論上說,每個人說話時的短時頻譜特徵、聲源特徵、時序動態特徵、韻律特徵、語言學特徵等都有差異,因此聲紋就像指紋一樣具有唯一性和獨特性,可以進行識別。
聲紋識別具有的優勢。
1、聲紋識別在金融領域的很多應用場景都是高頻使用,對用戶體驗方面的需求較高,如果驗證方式較為繁瑣,往往用戶難以接受,聲音信息一般不涉及用戶隱私問題,聲音採集通過一個麥克風或者電話、手機就可完成,用戶的接受度比較高;
2、更重要的是,聲紋不易纂改,再加之聲音信號中含有語言信息、副語言信息和非語言信息,綜合利用聲音中蘊含的豐富信息可以具備較高的安全特性。
以上內容參考人民網——聞聲識人:聲紋識別讓金融安全聽得見