[发明专利]一种声纹识别方法和装置有效
申请号: | 201810382018.0 | 申请日: | 2018-04-25 |
公开(公告)号: | CN108520752B | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 白仲鑫;张晓雷;陈景东 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G10L17/08 | 分类号: | G10L17/08;G10L17/04;G10L17/02 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 王文红 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声纹 识别 方法 装置 | ||
1.一种声纹识别方法,其特征在于,包括:
获取第一向量和第二向量,其中,所述第一向量为待测试语音波形的紧凑表示向量,所述第二向量为已知语音波形的紧凑表示向量,所述已知语音波形为所属于目标对象的语音数据,所述待测试语音波形为被测试的是否属于所述目标对象的语音数据;
获取变换矩阵,其中,所述变换矩阵为对所述第一向量和所述第二向量中的信道变化信息进行补偿的矩阵;
基于所述变换矩阵分别对所述第一向量和所述第二向量进行补偿,得到第一目标向量和第二目标向量;
通过计算所述第一目标向量和所述第二目标向量的余弦相似度来确定所述待测试语音波形是否属于所述目标对象。
2.根据权利要求1所述的方法,其特征在于,通过计算所述第一目标向量和所述第二目标向量的余弦相似度来确定所述待测试语音波形是否属于所述目标对象包括:
通过公式来计算所述余弦相似度,其中,x为所述第一向量,y为所述第二向量,A为所述变换矩阵;
当所述余弦相似度大于或等于预设值时,确定所述待测试语音波形属于所述目标对象;
当所述余弦相似度小于预设值时,确定所述待测试语音波形不属于所述目标对象。
3.根据权利要求1所述的方法,其特征在于,获取变换矩阵包括:
通过第一公式和正则化处理公式确定所述变换矩阵;
其中,所述第一公式为g(A)为得分间隔,(xi,yi)为两段音频波形的紧凑表示向量组成的训练样本对,所述训练样本对中的两段音频波形来自于同一个说话对象,或者,不同的说话对象;pos={i|li=1},pos为S个训练样本对中正例样本对集合,neg={i|li=0},neg为S个训练样本对中反例样本对集合;所述正则化处理公式为:h(A)=||A-A0||2,A0为预先定义的矩阵,所述预先定义的矩阵A0使用以下方法之一得到:线性判别性分析、类内协方差规整和扰动属性投影法;其中,A为所述变换矩阵。
4.根据权利要求3所述的方法,其特征在于,通过第一公式和正则化处理公式确定所述变换矩阵包括:
基于所述第一公式和所述正则化处理公式确定第二公式,其中,所述第二公式表示为:其中,α,β≥0,参数α和参数β均为平衡因子,f(A)为优化目标;
通过第二公式得到所述优化目标的最大值,并将所述优化目标的最大值所对应的矩阵确定为所述变换矩阵A。
5.根据权利要求4所述的方法,其特征在于,通过第二公式得到所述优化目标的最大值,并将所述优化目标的最大值所对应的矩阵确定为所述变换矩阵A包括:对所述第二公式进行求解,得到所述变换矩阵A,具体包括以下步骤:
初始化步骤:设定初始点A(0),所述预先定义的矩阵A0,参数α和参数β,其中,精度ε>0,令k=0;
第一计算步骤,基于所述优化目标的梯度计算公式计算梯度其中,f(A)为所述优化目标;
判断步骤,判断是否成立,其中,当成立时,则迭代结束,并设置A*=A(k),以及确定A(k)为所述变换矩阵A,否则进行第二计算步骤和设置步骤,其中,A*为所述优化目标的最大值所对应的矩阵;
所述第二计算步骤,基于精确一维搜索法求的一个极小点λk,使得
所述设置步骤,设置k=k+1,并返回执行所述第一计算步骤。
6.根据权利要求5所述的方法,其特征在于,所述优化目标的梯度计算公式为:
其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810382018.0/1.html,转载请声明来源钻瓜专利网。