[发明专利]音频指纹提取方法、装置、计算机设备和存储介质在审
申请号: | 202110260352.0 | 申请日: | 2021-03-10 |
公开(公告)号: | CN113113051A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 黄润乾 | 申请(专利权)人: | 深圳市声扬科技有限公司 |
主分类号: | G10L25/87 | 分类号: | G10L25/87;G10L21/0208;G06F16/683;G06F16/61 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 吴平 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 指纹 提取 方法 装置 计算机 设备 存储 介质 | ||
1.一种音频指纹提取方法,其特征在于,所述方法包括:
获取音频信号,对所述音频信号进行语音端点检测处理,识别所述音频信号中的噪声音频;
获取所述音频信号对应的星谱图,清除所述噪声音频在所述星谱图中对应的星点,得到更新星谱图;
根据所述更新星谱图,得到音频特征哈希数据;
根据所述音频特征哈希数据,得到音频指纹。
2.根据权利要求1所述的方法,其特征在于,所述音频信号包括目标音频和噪声音频;所述获取音频信号,对所述音频信号进行语音端点检测处理,识别所述音频信号中的噪声音频包括:
获取音频信号,基于语音端点检测深度学习模型,对所述音频信号进行语音端点检测处理,识别所述音频信号中的噪声音频和目标音频,所述语音端点检测深度学习模型通过音频训练数据构建。
3.根据权利要求2所述的方法,其特征在于,所述更新星谱图为目标音频对应的星谱图;所述语音端点检测深度学习模型的训练过程包括:
获取携带有分类标签的音频训练数据,所述音频训练数据包括目标音频训练数据和噪声音频训练数据;
获取初始的语音端点检测深度学习模型,根据所述音频训练数据,通过语音端点检测算法对所述初始的语音端点检测深度学习模型进行训练,得到语音端点检测深度学习模型。
4.根据权利要求2所述的方法,其特征在于,所述获取所述音频信号对应的星谱图,清除所述噪声音频在所述星谱图中对应的星点,得到更新星谱图之前,还包括:
对所述目标音频进行语音增强处理,所述语音增强处理包括基于谱减法的语音增强处理以及基于深度学习算法的语音增强处理中的任意一种。
5.根据权利要求1所述的方法,其特征在于,所述获取所述音频信号对应的星谱图,清除所述噪声音频在所述星谱图中对应的星点,得到更新星谱图包括:
基于音频指纹算法,提取所述音频信号对应的星谱图,所述星谱图上的星点沿时间轴分布;
沿所述时间轴对所述星谱图中各时刻的星点进行检测;
当检测到所述星点对应的音频信号为噪声音频时,清除所述噪声音频对应的星点,得到更新星谱图。
6.根据权利要求5所述的方法,其特征在于,所述音频特征哈希数据包括音频特征哈希表;所述根据所述更新星谱图,得到音频特征哈希数据包括:
根据所述目标音频对应的更新星谱图中的任意两个星点,构成哈希键;
根据所述哈希键以及所述哈希键对应的哈希值,构建音频特征哈希表。
7.根据权利要求6所述的方法,其特征在于,所述根据所述哈希键以及所述哈希键对应的哈希值,构建音频特征哈希表包括:
根据所述任意两个星点在所述时间轴上的时间偏差,确定所述哈希键对应的哈希值;
根据所述哈希键以及所述哈希键对应的哈希值,得到哈希对;
根据所述哈希对,构建音频特征哈希表。
8.一种音频指纹提取装置,其特征在于,所述装置包括:
音频信号获取模块,用于获取音频信号,对所述音频信号进行语音端点检测处理,识别所述音频信号中的噪声音频;
噪声音频清除模块,用于获取所述音频信号对应的星谱图,清除所述噪声音频在所述星谱图中对应的星点,得到更新星谱图;
音频数据处理模块,用于根据所述更新星谱图,得到音频特征哈希数据;
音频指纹生成模块,用于根据所述音频特征哈希数据,得到音频指纹。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市声扬科技有限公司,未经深圳市声扬科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110260352.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:使用应用容器管理代码和依赖性数据的传递
- 下一篇:一种防踢落防触电安全插座