[发明专利]一种声纹识别方法及装置有效
申请号: | 201710584651.3 | 申请日: | 2017-07-17 |
公开(公告)号: | CN107527624B | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 李健;张连毅;武卫东 | 申请(专利权)人: | 北京捷通华声科技股份有限公司 |
主分类号: | G10L21/0316 | 分类号: | G10L21/0316;G10L21/0324;G10L21/0364;G10L17/00 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声纹 识别 方法 装置 | ||
本发明实施例提供了一种声纹识别方法,属于生物识别技术领域。该方法包括:确定接收到的语音信号的传播距离,确定所述语音信号接收处的声压级,以及确定空气相对湿度;根据所述传播距离,所述语音信号接收处的声压级和所述空气相对湿度,确定所述语音信号的各个频率段对应的补偿系数;根据所述语音信号的各个频率段对应的补偿系数,对所述语音信号进行幅度补偿;对幅度补偿后的语音信号进行声纹特征计算,以进行声纹识别。本发明实施例可以根据语音信号的各个频率段在传播过程中的不同衰减程度,进行具有针对性的补偿,能够大大提高声纹识别的准确度。
技术领域
本发明涉及生物识别技术领域,特别是涉及一种声纹识别方法及装置。
背景技术
声纹识别技术作为生物识别技术中的重要分支,被广泛应用至生活中的各个领域。比如,在金融领域,声纹识别可以用于识别不同的银行用户,以保证银行用户的信息和财产安全;在网络安全领域,不同的用户可以通过语音口令进行账号登录和操作,从而保证用户账号的安全性;在刑侦领域,还可以通过声纹识别技术分析电话录音,有效查找犯罪嫌疑人等等。因此,声纹识别技术具有十分广阔的应用前景。
在先前的技术中,通常采用的声纹识别方法为:首先通过麦克风阵列采集语音,然后对采集的语音进行声纹特征计算,将计算得到的声纹特征与已知的多个用户的声纹特征进行匹配,并将该多个用户中声纹特征与采集的声纹特征匹配度最高的用户,确定为发出该声纹特征的用户,从而实现声纹识别。
发明人在应用上述技术的过程中发现,在远场场景下,也即在用户距离声纹识别装置较远的情况下,语音传播至声纹识别装置的麦克风阵列所经历的时间较长,因此会造成一定程度上的语音衰减,尤其是语音中高频成分的衰减程度较大,从而降低了声纹识别的准确度。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种声纹识别方法及装置。
根据本发明的第一方面,提供了一种声纹识别方法,所述方法包括:
确定接收到的语音信号的传播距离,确定所述语音信号接收处的声压级,以及确定空气相对湿度;
根据所述传播距离,所述语音信号接收处的声压级和所述空气相对湿度,确定所述语音信号的各个频率段对应的补偿系数;
根据所述语音信号的各个频率段对应的补偿系数,对所述语音信号进行幅度补偿;
对幅度补偿后的语音信号进行声纹特征计算,以进行声纹识别。
可选地,所述根据所述传播距离,所述语音信号接收处的声压级和所述空气相对湿度,确定所述语音信号的各个频率段对应的补偿系数,包括:
对于所述语音信号的任一频率段,根据所述传播距离和所述空气相对湿度,通过下述公式(1)确定所述频率段对应的空气吸收系数;
其中,所述Aa为所述频率段对应的空气吸收系数,所述f为所述频率段的中心频率,所述r为所述传播距离,所述φ为所述空气相对湿度;
根据所述传播距离,通过下述公式(2)确定辐射衰减系数;
K=10log10 4π+20log10 r (2)
其中,所述K为辐射衰减系数,所述π为圆周率;
根据所述语音信号接收处的声压级,所述辐射衰减系数和所述频率段对应的空气吸收系数,通过下述公式(3)确定所述语音信号的声源处的声压级:
Lw=Lp+K+Aa (3)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710584651.3/2.html,转载请声明来源钻瓜专利网。