[发明专利]音频比对方法、装置和设备有效
| 申请号: | 201910376542.1 | 申请日: | 2019-05-07 |
| 公开(公告)号: | CN110085259B | 公开(公告)日: | 2021-09-17 |
| 发明(设计)人: | 王健;周凯;王小稳;付润豪;赵爱国 | 申请(专利权)人: | 国家广播电视总局中央广播电视发射二台;北京国广电科技有限公司 |
| 主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/24;G10L25/18;G10L25/27 |
| 代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 牛晴 |
| 地址: | 100045 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 方法 装置 设备 | ||
本发明涉及一种音频比对方法、装置和设备,包括:接收需要比对的至少两路音频信号;对每路音频信号进行预处理,使每路音频信号均包含M个音频帧;基于每路音频信号中每个音频帧对应的特征信息,确定每路音频信号的特征序列;根据特征序列,计算相关函数序列;根据相关函数序列,确定任意两路音频信号之间的延迟时间;若延迟时间小于参考延迟时间,根据相关函数序列计算任意两路音频信号的相关系数;若相关系数大于预设系数,则确定至少两路音频信号为相同的信号。本方案提取需要比对的音频信号的多个特征,综合多个特征进行多维度比对,因此即使在噪声较大、干扰较大的场合也能获得较高的正确率,实用性高。
技术领域
本发明涉及信号处理技术领域,具体涉及一种音频比对方法、装置和设备。
背景技术
当前,音频广播已成为最为普及的大众宣传和娱乐媒体。广播电台的节目播出及媒体资源管理等都涉及到音频比对方面的需求,即对两个音频进行比较,判断二者是否相同或相似。
现有技术中的音频比对方法,都是基于梅尔倒频谱系数(MelFrequency CepstrumCoefficient,MFCC)序列这一特征,通过MFCC算法提取音频特征参数,再根据音频特征参数的欧氏距离来判定音频的相似性,但是这种方式仅仅适用于音频质量较高的情况,如果音频质量不高,存在噪声,使用场合有一定的干扰,则会有较高的误报率。
发明内容
有鉴于此,本发明的目的在于提供一种音频比对方法、装置和设备,以克服目前如果音频质量不高,存在噪声,使用场合有一定的干扰,则会有较高的误报率的问题。
为实现以上目的,本发明采用如下技术方案:
一种音频比对方法,包括:
接收需要比对的至少两路音频信号;
对每路所述音频信号进行预处理,使每路所述音频信号均包含M个音频帧;所述M为正整数;
基于每路所述音频信号中每个所述音频帧对应的特征信息,确定每路所述音频信号的特征序列;
根据所述特征序列,计算相关函数序列;
根据所述相关函数序列,确定任意两路所述音频信号之间的延迟时间;
比较所述延迟时间与参考延迟时间的大小;
若所述延迟时间小于所述参考延迟时间,根据所述相关函数序列计算任意两路所述音频信号的相关系数;
若所述相关系数大于预设系数,则确定至少两路所述音频信号为相同的信号。
进一步地,以上所述音频比对方法,所述对每路所述音频信号进行预处理,使每路所述音频信号均包含M个音频帧,包括:
分别重采样并取长度为N的采样序列;所述N为正整数;
对每路所述采样序列进行预加重和归一化处理,得到目标采样序列;
对每路所述目标采样序列进行音频帧划分,使每路所述目标采样序列包含M个音频帧。
进一步地,以上所述音频比对方法,所述根据所述特征序列,计算相关函数序列,包括:
分别对每路所述特征序列进行离散傅里叶变换,得到第一中间序列和第二中间序列;
获取所述第一中间序列的复数共轭,将所述复数共轭与所述第二中间序列逐元素相乘得到第三中间序列;
对所述第三中间序列进行逆离散傅里叶变换,得到中间相关函数序列;
将所述中间相关函数序列的第一部分与第二部分重新拼接,得到所述相关函数序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家广播电视总局中央广播电视发射二台;北京国广电科技有限公司,未经国家广播电视总局中央广播电视发射二台;北京国广电科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910376542.1/2.html,转载请声明来源钻瓜专利网。





