Ⅰ 什么是声纹识别
语音携带的信息非常丰富,大家普遍了解的语音识别是指对语音内容的识别技术,即解决了“给定语音到底说了什么”的问题。
声纹识别简单的说就是判断给定的一句话到底是谁说的技术。早在上世纪40年代末期就有相关研究者开始进行相关技术的探索,主要应用于军事情报领域。其理论基础就是“每个人的说话特性都具有其独特的特征”,而决定这种独特特征的主要因素有:
1、声腔的差异,其包括咽喉、鼻腔、口腔以及胸腔等,这些欺诳的形状、尺寸和位置决定了声腔的差异。因此大家可以感受到,不同的人说话,其声音的频率分布是不同的;
2、发声的操作方式,主要是指唇、口齿、舌头等部位在发声时的相互作用。
一般而言,人在逐渐的学习过程中就会慢慢的形成了自己的声纹特性,正常说话时的声纹状态还是相对稳定的。但是声纹特性仍然具有易变性,因为影响声纹特性的两个因素非常容易受身体状况、年龄、情绪等情况的干扰,从而导致声纹特性的变化。例如:人随着年龄的变化声纹特性也在随之变化,尤其是小时候和成年后;人在感冒时由于鼻腔堵塞等问题会明显感觉到声纹特性的不一致等。当然,人也可以通过刻意的模仿等形成不同的声纹特性。总而言之,声纹特征是类似于虹膜、指纹等一种具有独特性的生物特征。
声纹识别从任务上来说,主要分为声纹确认技术(1:1)和声纹识别技术(1:N)两类。声纹确认技术回答的是两句话到底是不是一个人说的问题,而声纹识别技术回答的则是”给定的一句话属于样本库中谁说的”问题。
Ⅱ 声纹识别技术原理是什么
声纹识别技术原理是利用声音的独特性来识别人物的,声纹识别简单地说,就是通过声音进行说话人身份识别的过程。语音信号之所以被形容为“形简意丰”,是因为声音包含有内容、身份、情感、年龄及健康状况等丰富的信息。
人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,理论上说,每个人说话时的短时频谱特征、声源特征、时序动态特征、韵律特征、语言学特征等都有差异,因此声纹就像指纹一样具有唯一性和独特性,可以进行识别。
声纹识别具有的优势。
1、声纹识别在金融领域的很多应用场景都是高频使用,对用户体验方面的需求较高,如果验证方式较为繁琐,往往用户难以接受,声音信息一般不涉及用户隐私问题,声音采集通过一个麦克风或者电话、手机就可完成,用户的接受度比较高;
2、更重要的是,声纹不易纂改,再加之声音信号中含有语言信息、副语言信息和非语言信息,综合利用声音中蕴含的丰富信息可以具备较高的安全特性。
以上内容参考人民网——闻声识人:声纹识别让金融安全听得见