[发明专利]音频识别方法、装置、设备及存储介质在审
| 申请号: | 202111672116.6 | 申请日: | 2021-12-31 |
| 公开(公告)号: | CN114386006A | 公开(公告)日: | 2022-04-22 |
| 发明(设计)人: | 张新成;任伟;王吉 | 申请(专利权)人: | 北京梧桐车联科技有限责任公司 |
| 主分类号: | G06F21/32 | 分类号: | G06F21/32;G06F16/635 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 邢少真 |
| 地址: | 100089 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 识别 方法 装置 设备 存储 介质 | ||
本申请公开了音频识别方法、装置、设备及存储介质,属于计算机技术领域。所述方法包括:获取待识别音频,待识别音频对应的对象信息未知;获取待识别音频的多个第一声纹,获取基准音频的多个第二声纹,基准音频对应的对象信息已知;将多个第一声纹与多个第二声纹进行匹配,得到待识别音频与基准音频的匹配结果;基于匹配结果得到待识别音频的音频识别结果。通过获取多个第一声纹与多个第二声纹,基于多个第一声纹与多个第二声纹的相互匹配,增加了待识别音频与基准音频的声纹匹配精度,从而提高了音频识别结果的准确率。
技术领域
本申请实施例涉及计算机技术领域,特别涉及一种音频识别方法、装置、设备及存储介质。
背景技术
随着计算机技术的不断发展,信息安全的重要性逐渐提升,其中,身份认证为保证信息安全的重要一环。
例如,通过对音频进行识别完成身份认证,身份认证通过的对象才有权利获取所保护的信息。因此,亟需一种音频识别方法。
发明内容
本申请实施例提供了一种音频识别方法、装置、设备及存储介质,可用于解决相关技术中的问题。所述技术方案如下:
一方面,本申请实施例提供了一种音频识别方法,所述方法包括:
获取待识别音频,所述待识别音频对应的对象信息未知;
获取所述待识别音频的多个第一声纹,获取基准音频的多个第二声纹,所述基准音频对应的对象信息已知;
将所述多个第一声纹与所述多个第二声纹进行匹配,得到所述待识别音频与所述基准音频的匹配结果;
基于所述匹配结果得到所述待识别音频的音频识别结果。
在一种可能的实现方式中,所述获取所述待识别音频的多个第一声纹,包括:
对所述待识别音频进行音频切分,得到多个第一音频;
提取所述多个第一音频中的各个第一音频的声纹,得到所述多个第一声纹。
在一种可能的实现方式中,所述对所述待识别音频进行音频切分,得到多个第一音频,包括:
确定用于音频切分的移动窗口的长度与所述移动窗口的步长,所述移动窗口的长度小于所述待识别音频的长度;
基于所述移动窗口的长度与所述步长对所述待识别音频进行音频切分,得到多个长度为所述移动窗口的长度的第一音频。
在一种可能的实现方式中,所述移动窗口为多个,所述多个移动窗口中的任一移动窗口的长度与其他移动窗口的长度不同,所述任一移动窗口的长度不大于所述待识别音频的长度;
所述任一移动窗口的步长与所述其他移动窗口的步长不同,所述其他移动窗口为所述多个移动窗口中除所述任一移动窗口之外的移动窗口。
在一种可能的实现方式中,所述将所述多个第一声纹与所述多个第二声纹进行匹配,得到所述待识别音频与所述基准音频的匹配结果,包括:
获取所述多个第一声纹中的各个第一声纹与所述多个第二声纹中的各个第二声纹之间的相似度;
基于所述相似度与匹配阈值之间的关系得到所述待识别音频与所述基准音频的匹配结果。
在一种可能的实现方式中,所述基于所述相似度与匹配阈值之间的关系得到所述待识别音频与所述基准音频的匹配结果,包括:
响应于所述多个第一声纹中的任一第一声纹与所述多个第二声纹中的任一第二声纹之间的相似度大于所述匹配阈值,则所述匹配结果为所述待识别音频与所述基准音频匹配成功;
所述基于所述匹配结果得到所述待识别音频的音频识别结果,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京梧桐车联科技有限责任公司,未经北京梧桐车联科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111672116.6/2.html,转载请声明来源钻瓜专利网。





