[发明专利]一种声纹识别方法及装置有效
申请号: | 201710584651.3 | 申请日: | 2017-07-17 |
公开(公告)号: | CN107527624B | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 李健;张连毅;武卫东 | 申请(专利权)人: | 北京捷通华声科技股份有限公司 |
主分类号: | G10L21/0316 | 分类号: | G10L21/0316;G10L21/0324;G10L21/0364;G10L17/00 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声纹 识别 方法 装置 | ||
1.一种声纹识别方法,其特征在于,所述方法包括:
确定接收到的语音信号的传播距离,确定所述语音信号接收处的声压级,以及确定空气相对湿度;
根据所述传播距离,所述语音信号接收处的声压级和所述空气相对湿度,确定所述语音信号的各个频率段对应的补偿系数;
根据所述语音信号的各个频率段对应的补偿系数,对所述语音信号进行幅度补偿;
对幅度补偿后的语音信号进行声纹特征计算,以进行声纹识别;
其中,所述根据所述传播距离,所述语音信号接收处的声压级和所述空气相对湿度,确定所述语音信号的各个频率段对应的补偿系数,包括:
对于所述语音信号的任一频率段,根据所述传播距离和所述空气相对湿度,通过下述公式(1)确定所述频率段对应的空气吸收系数;
其中,所述Aa为所述频率段对应的空气吸收系数,所述f为所述频率段的中心频率,所述r为所述传播距离,所述φ为所述空气相对湿度;
根据所述传播距离,通过下述公式(2)确定辐射衰减系数;
K=10log104π+20log10r (2)
其中,所述K为辐射衰减系数,所述π为圆周率;
根据所述语音信号接收处的声压级,所述辐射衰减系数和所述频率段对应的空气吸收系数,通过下述公式(3)确定所述语音信号的声源处的声压级;
Lw=Lp+K+Aa (3)
其中,所述Lw为所述语音信号的声源处的声压级,所述Lp为所述语音信号接收处的声压级;
根据所述语音信号的声源处的声压级,通过下述公式(4)确定所述频率段对应的补偿系数;
其中,所述a为所述频率段对应的补偿系数;
其中,所述根据所述语音信号的各个频率段对应的补偿系数,对所述语音信号进行幅度补偿,包括:
将所述语音信号的各个频率段内的各个频率的幅度值乘以所述语音信号的各个频率段对应的补偿系数,得到所述语音信号的各个频率段对应的补偿后的幅度值。
2.根据权利要求1所述的方法,其特征在于,所述确定接收到的语音信号的传播距离,包括:
对于麦克风阵列包括的任意两个麦克风,确定所述两个麦克风分别接收到的语音信号的互相关函数;
确定所述互相关函数的最大值;
将所述互相关函数的最大值对应的时间确定为所述两个麦克风分别接收到的所述语音信号的时延;
根据确定的多个时延和所述麦克风阵列包括的各个麦克风的位置,确定多组双曲线或多组双曲面;
将所述多组双曲线或多组双曲面的交点确定为产生所述语音信号的声源的位置;
将所述麦克风阵列的位置与所述产生所述语音信号的声源的位置之间的距离确定为所述语音信号的传播距离。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述语音信号由时域转换至频域,得到所述语音信号的频谱;
按照设定频率间隔将所述语音信号的频谱中的各个频率划分为各个频率段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710584651.3/1.html,转载请声明来源钻瓜专利网。