[发明专利]音频指纹提取方法、装置、计算机设备和存储介质在审
申请号: | 202110260352.0 | 申请日: | 2021-03-10 |
公开(公告)号: | CN113113051A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 黄润乾 | 申请(专利权)人: | 深圳市声扬科技有限公司 |
主分类号: | G10L25/87 | 分类号: | G10L25/87;G10L21/0208;G06F16/683;G06F16/61 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 吴平 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 指纹 提取 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种音频指纹提取方法、装置、计算机设备和存储介质。所述方法包括:获取音频信号,对音频信号进行语音端点检测处理,识别音频信号中的噪声音频;获取音频信号对应的星谱图,清除噪声音频在星谱图中对应的星点,得到更新星谱图;根据更新星谱图,得到音频特征哈希数据;根据音频特征哈希数据,得到音频指纹。采用本方法能够有效抵御噪声音频对音频指纹提取的影响,提高了噪声鲁棒性。
技术领域
本申请涉及音频指纹技术领域,特别是涉及一种音频指纹提取方法、装置、计算机设备和存储介质。
背景技术
随着音频指纹技术的发展,当前已被广泛用于音乐识别、版权内容监播等等领域。通过音频指纹技术可以将音频信号中独一无二的特征信息提取出来,用于海量声音样本的识别、搜索和定位服务,音频指纹技术是一种可以自动识别音频内容的技术。
音频指纹技术会从音频信号中提取出噪声鲁棒性的特征,传统的音频指纹技术虽然具备噪声鲁棒性,但仅限于微弱的噪声音频与目标音频重叠的情况。在存在噪声音频的干扰信号时,不仅包含与目标音频重叠的叠加噪声,还包含与目标音频并列的噪声的情况,在噪声音频较强且与目标音频未叠加的比例较高时,即噪声音频与目标音频并列的情况下,传统的音频指纹技术无法保证其噪声鲁棒性,噪声音频对音频指纹识别的结果影响非常大。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高噪声鲁棒性的音频指纹提取方法、装置、计算机设备和存储介质。
一种音频指纹提取方法,所述方法包括:
获取音频信号,对音频信号进行语音端点检测处理,识别音频信号中的噪声音频;
获取音频信号对应的星谱图,清除噪声音频在星谱图中对应的星点,得到更新星谱图;
根据更新星谱图,得到音频特征哈希数据;
根据音频特征哈希数据,得到音频指纹。
在其中一个实施例中,音频信号包括目标音频和噪声音频;获取音频信号,对音频信号进行语音端点检测处理,识别音频信号中的噪声音频包括:
获取音频信号,基于语音端点检测深度学习模型,对音频信号进行语音端点检测处理,识别音频信号中的噪声音频和目标音频,语音端点检测深度学习模型通过音频训练数据构建。
在其中一个实施例中,更新星谱图为目标音频对应的星谱图;语音端点检测深度学习模型的训练过程包括:
获取携带有分类标签的音频训练数据,音频训练数据包括目标音频训练数据和噪声音频训练数据;
获取初始的语音端点检测深度学习模型,根据音频训练数据,通过语音端点检测算法对初始的语音端点检测深度学习模型进行训练,得到语音端点检测深度学习模型。
在其中一个实施例中,获取音频信号对应的星谱图,清除噪声音频在星谱图中对应的星点,得到更新星谱图之前,还包括:
对目标音频进行语音增强处理,语音增强处理包括基于谱减法的语音增强处理以及基于深度学习算法的语音增强处理中的任意一种。
在其中一个实施例中,获取音频信号对应的星谱图,清除噪声音频在星谱图中对应的星点,得到更新星谱图包括:
基于音频指纹算法,提取音频信号对应的星谱图,星谱图上的星点沿时间轴分布;
沿时间轴对星谱图中各时刻的星点进行检测;
当检测到星点对应的音频信号为噪声音频时,清除噪声音频对应的星点,得到更新星谱图。
在其中一个实施例中,音频特征哈希数据包括音频特征哈希表;根据更新星谱图,得到音频特征哈希数据包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市声扬科技有限公司,未经深圳市声扬科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110260352.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:使用应用容器管理代码和依赖性数据的传递
- 下一篇:一种防踢落防触电安全插座