[发明专利]音频比对方法、装置和设备有效
| 申请号: | 201910376542.1 | 申请日: | 2019-05-07 |
| 公开(公告)号: | CN110085259B | 公开(公告)日: | 2021-09-17 |
| 发明(设计)人: | 王健;周凯;王小稳;付润豪;赵爱国 | 申请(专利权)人: | 国家广播电视总局中央广播电视发射二台;北京国广电科技有限公司 |
| 主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/24;G10L25/18;G10L25/27 |
| 代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 牛晴 |
| 地址: | 100045 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 方法 装置 设备 | ||
1.一种音频比对方法,其特征在于,包括:
接收需要比对的至少两路音频信号;
对每路所述音频信号进行预处理,使每路所述音频信号均包含M个音频帧;所述M为正整数;
获取每路所述音频信号中每个所述音频帧对应的谱质心序列,获取每路所述音频信号中每个所述音频帧对应的时域序列,获取每路所述音频信号中每个所述音频帧对应的过零率序列,和,获取每路所述音频信号中每个所述音频帧对应的梅尔倒谱系数MFCC序列;
根据所述谱质心序列、时域序列、过零率序列、MFCC序列,计算相关函数序列;
根据所述相关函数序列,确定任意两路所述音频信号之间的延迟时间;
比较所述延迟时间与参考延迟时间的大小;
若所述延迟时间小于所述参考延迟时间,根据所述相关函数序列计算任意两路所述音频信号的相关系数;
若所述相关系数大于预设系数,则确定至少两路所述音频信号为相同的信号;
若所述延迟时间大于或等于所述参考延迟时间,则将所述延迟时间剪切,重新对齐所述音频信号,以便再次对至少两路所述音频信号进行比对;
所述相关函数序列包括谱质心相关函数序列、时域相关函数序列、过零率相关函数序列和MFCC相关函数序列;
所述根据所述相关函数序列,确定任意两路所述音频信号之间的延迟时间,包括:
获取所述谱质心相关函数序列的第一最大位置和第一中点位置,求得所述第一最大位置和所述第一中点位置的第一差值,将所述第一差值乘以所述音频信号的采样频率,获得第一延迟时间;获取所述过零率相关函数序列的第二最大位置和第二中点位置,求得所述第二最大位置和所述第二中点位置的第二差值,将所述第二差值乘以所述采样频率,获得第二延迟时间;获取所述MFCC相关函数序列的第三最大位置和第三中点位置,求得所述第三最大位置和所述第三中点位置的第三差值,将所述第三差值乘以所述采样频率,获得第三延迟时间;计算所述第一延迟时间、所述第二延迟时间和所述第三延迟时间的平均值,将所述平均值作为所述延迟时间;
根据所述相关函数序列计算任意两路所述音频信号的相关系数,包括:
获取所述谱质心相关函数序列的最大值,作为谱质心相关系数,获取所述时域相关函数序列的最大值,作为时域相关系数,获取所述过零率相关函数序列的最大值,作为过零率相关系数,获取所述MFCC相关函数序列的最大值,作为MFCC相关系数;将所述谱质心相关系数、所述时域相关系数、所述过零率相关系数和所述MFCC相关系数的加权求和值作为所述相关系数。
2.根据权利要求1所述音频比对方法,其特征在于,所述对每路所述音频信号进行预处理,使每路所述音频信号均包含M个音频帧,包括:
分别重采样并取长度为N的采样序列;所述N为正整数;
对每路所述采样序列进行预加重和归一化处理,得到目标采样序列;
对每路所述目标采样序列进行音频帧划分,使每路所述目标采样序列包含M个音频帧。
3.根据权利要求1所述音频比对方法,其特征在于,所述根据所述特征序列,计算相关函数序列,包括:
分别对每路所述特征序列进行离散傅里叶变换,得到第一中间序列和第二中间序列;
获取所述第一中间序列的复数共轭,将所述复数共轭与所述第二中间序列逐元素相乘得到第三中间序列;
对所述第三中间序列进行逆离散傅里叶变换,得到中间相关函数序列;
将所述中间相关函数序列的第一部分与第二部分重新拼接,得到所述相关函数序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家广播电视总局中央广播电视发射二台;北京国广电科技有限公司,未经国家广播电视总局中央广播电视发射二台;北京国广电科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910376542.1/1.html,转载请声明来源钻瓜专利网。





