[发明专利]一种声纹识别方法和装置有效
申请号: | 201810382018.0 | 申请日: | 2018-04-25 |
公开(公告)号: | CN108520752B | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 白仲鑫;张晓雷;陈景东 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G10L17/08 | 分类号: | G10L17/08;G10L17/04;G10L17/02 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 王文红 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声纹 识别 方法 装置 | ||
本发明提供了一种声纹识别方法和装置,涉及声纹识别的技术领域,该方法包括:获取第一向量和第二向量,其中,第一向量为待测试语音波形的紧凑表示向量,第二向量为已知语音波形的紧凑表示向量,已知语音波形为所属于目标对象的语音数据,待测试语音波形为被测试的是否属于目标对象的语音数据;获取变换矩阵;基于变换矩阵分别对第一向量和第二向量进行补偿,得到第一目标向量和第二目标向量;通过计算第一目标向量和第二目标向量的余弦相似度来确定待测试语音波形是否属于目标对象。本发明解决了现有技术中在复杂场景下的声纹识别精度无法满足应用需求的技术问题。
技术领域
本发明涉及声纹识别的技术领域,尤其是涉及一种声纹识别方法和装置。
背景技术
声纹识别是一种非常有用的生物识别技术,在安防、音频检索等领域具有广阔的应用前景。声纹识别包括说话人确认(Speaker Verification)和说话人检索(SpeakerIdentification)两大核心任务,前者是指确认某段未知语音是否由声称说话人发出,而后者的目标是在已有说话人的集合中检索输入语音的发出者。
声纹识别技术的研究起始于20世纪60年代,2000年麻省理工学院的林肯实验室提出了通用背景模型(Universal Background Model,UBM)奠定了现代声纹识别技术的基础。2010年Najim Dehak等人发表的论文提出了身份向量(Identity Vectors,i-vector)以及余弦得分进一步提升了声纹识别的性能。
经过几十年的发展,声纹识别技术取得了长足的进步,但是在信道变化、噪声环境、注册及测试语音有限、多说话人混叠等复杂场景下目前的声纹识别技术在识别精度上依然无法满足应用需求。
针对以上问题,还未提出有效解决方案。
发明内容
有鉴于此,本发明的目的在于提供一种声纹识别方法和装置,以解决现有技术中在复杂场景下的声纹识别精度无法满足应用需求的技术问题。
本发明实施例提供了一种声纹识别方法,包括:获取第一向量和第二向量,其中,所述第一向量为待测试语音波形的紧凑表示向量,所述第二向量为已知语音波形的紧凑表示向量,所述已知语音波形为所属于目标对象的语音数据,所述待测试语音波形为被测试的是否属于所述目标对象的语音数据;获取变换矩阵,其中,所述变换矩阵为对所述第一向量和所述第二向量中的信道变化信息进行补偿的矩阵;基于所述变换矩阵分别对所述第一向量和所述第二向量进行补偿,得到第一目标向量和第二目标向量;通过计算所述第一目标向量和所述第二目标向量的余弦相似度来确定所述待测试语音波形是否属于所述目标对象。
进一步地,通过计算所述第一目标向量和所述第二目标向量的余弦相似度来确定所述待测试语音波形是否属于所述目标对象包括:通过公式来计算所述余弦相似度,其中,x为所述第一向量,y为所述第二向量,A为所述变换矩阵;当所述余弦相似度大于或等于预设值时,确定所述待测试语音波形属于所述目标对象;当所述余弦相似度小于预设值时,确定所述待测试语音波形不属于所述目标对象。
进一步地,获取变换矩阵包括:通过第一公式和正则化处理公式确定所述变换矩阵,其中,,所述第一公式为:g(A)为得分间隔,(xi,yi)为两段音频波形的紧凑表示向量组成的训练样本对,所述训练样本对中的两段音频波形来自于同一个说话对象,或者,不同的说话对象;pos={i|li=1},pos为S个训练样本对中正例样本对集合,neg={i|li=0},neg为S个训练样本对中反例样本对集合;所述正则化处理公式为:h(A)=||A-A0||2,A0为预先定义的矩阵,所述预先定义的矩阵A0使用以下方法之一得到:线性判别性分析、类内协方差规整和扰动属性投影法;其中,A为所述变换矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810382018.0/2.html,转载请声明来源钻瓜专利网。