[发明专利]一种基于声纹和语音的防录音假冒身份识别方法及系统无效
申请号: | 201210172697.1 | 申请日: | 2012-05-30 |
公开(公告)号: | CN102708867A | 公开(公告)日: | 2012-10-03 |
发明(设计)人: | 成波 | 申请(专利权)人: | 北京正鹰科技有限责任公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L15/28 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 声纹 语音 录音 假冒 身份 识别 方法 系统 | ||
技术领域
本发明属于计算机及信息服务技术领域,特别涉及通过语音中的人类的声纹信息和语音内容对其声称的身份进行识别的方法及系统。
背景技术
声纹识别技术
声纹识别(Voiceprint Recognition,VPR)技术属于生物识别技术的一种,是一项根据语音中反映说话人生理和行为特征的语音参数,来识别语音话者身份的技术。由于每个人的发声器官(舌、牙齿、喉头、肺、鼻腔)在尺寸和形态方面不尽相同,因此声纹也就成为一种鉴别说话人身份的识别手段。
声纹识别系统是以说话人的语音作为输入,用训练得到的特定人声纹模型来识别待测语音的话者身份。声纹识别系统一般包括两个步骤:声纹建模(Voiceprint Modeling)和声纹验证(Voiceprint Verification)。声纹识别系统在实际应用时,常常会面临一个两难选择问题,即如何确定声纹识别系统的错误拒绝率和错误接受率。错误拒绝率是指拒绝合法说话人而造成的错误,错误接受率是指接受非法说话人而造成的错误,二者与阈值的设定相关。在实际应用环境下,两者无法同时达到最小,需要调整系统阈值来满足不同应用的需求。例如在强调“易用性”的情况下,可以让错误拒绝率低一些,此时错误接受率会增加,从而导致安全性有所降低;在强调“安全性”的情况下,可以让错误接受率低一些,此时错误拒绝率会增加,从而导致系统的易用性有所降低。前者可以概括为“宁错勿漏”,而后者则是“宁漏勿错”。通常,系统的阈值会在开发前根据实际环境的语音调优得到,在系统投入实际应用后,还需要根据实际数据再做一下调整,以便更好的贴近实际情况。
声纹识别技术有着非常广阔的应用前景:
(1)它可以作为个人身份核查和安全检查的一种手段;
(2)它可以作为特定人群的一种识别手段;
(3)它可以作为一种同一说话人的鉴别手段。
在现有技术中,声纹识别方法包括声纹建模和声纹验证两个部分。
其中,声纹建模方法的流程,如图1(a)所示,包括以下步骤:
采集用户语音并提取声纹特征;
基于提取出的声纹特征,训练声纹模型,即建立该用户的声纹模型;声纹建模时用到的方法可采用任何已有的方法(如MAP、MLLR、EigenVoice等)。
声纹验证方法的流程如图1(b)所示,包括以下步骤:
从采集的待识别语音中提取声纹特征;
读取指定的待比对声纹模型;
将提取出的声纹特征,与读取的声纹模型进行匹配比较(如计算概率似然得分等),得到匹配得分Score;
将匹配得分Score与系统设定的阈值相比对,如果大于阈值,则声纹验证成功,认为待识别语音的话者身份与指定的声纹模型对应的话者身份相同,是同一个说话人,结束;否则,声纹验证失败,认为待识别语音的话者身份与指定的声纹模型对应的话者身份不相同,是不同的说话人,结束。
所述的阈值是指,在大量的声纹识别测试的匹配得分Score中,得到的一个参考值。该值用于界定待识别语音与指定的声纹模型是否出自同一个说话人。
语音识别技术
ASR是自动语音识别(Automatic Speech Recognition)的缩写,是一种让计算机通过识别和理解过程把语音信号转变为相应的文本或命令的技术,即“音”到“字”的转换。语音识别按照任务种类和应用可以分为:(1)孤立词识别(Isolated Word Recognition),或命令词识别。它的任务是识别事先已知的命令词,如“开机”、“关机”等;(2)关键词识别或关键词检出(Keyword Spotting)。它的任务不是识别全部的文字,而是检测语音信号中是否出现预设词表里的关键词,如在语音中检测是否出现“计算机”这个词;(3)连续语音识别。它的任务是识别语音中的全部文字。
语音识别的应用领域非常广泛,常见的应用系统有:(1)语音输入系统,相对于键盘输入方法,它更符合人的日常习惯,也更自然、更高效;(2)语音控制系统,即用语音来控制设备的运行,相对于手动控制来说更加快捷、方便,可以用在诸如工业控制、语音拨号系统、智能家电、声控智能玩具等许多领域;(3)智能对话查询系统,根据客户的语音进行操作,为用户提供自然、友好的数据库检索服务,例如家庭服务、宾馆服务、旅行社服务系统、订票系统、医疗服务、银行服务、股票查询服务等等。
已有的语音识别方法的应用流程如图2所示,包括以下步骤:
采集用户的语音并提取声学特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京正鹰科技有限责任公司,未经北京正鹰科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210172697.1/2.html,转载请声明来源钻瓜专利网。