[发明专利]一种抗变调干扰的音频指纹提取方法有效
申请号: | 201910833151.8 | 申请日: | 2019-09-04 |
公开(公告)号: | CN110767248B | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 褚仁杰;牛保宁;姚姗姗 | 申请(专利权)人: | 太原理工大学 |
主分类号: | G10L25/18 | 分类号: | G10L25/18;G10L25/54;G10L21/14;G06F16/61;G06F16/683 |
代理公司: | 太原晋科知识产权代理事务所(特殊普通合伙) 14110 | 代理人: | 任林芳 |
地址: | 030024 *** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 变调 干扰 音频 指纹 提取 方法 | ||
1.一种抗变调干扰的音频指纹提取方法,其特征在于,包括:
对音频信号分帧加窗,做傅里叶变换,收集每帧信号对应的傅里叶系数;
在收集到的傅里叶系数中,用基于峰值点的能量段索引计算方法计算每帧信号对应的能量段索引;
用基于峰值点的能量段索引计算方法计算每帧信号对应的能量段索引的步骤包括:
利用峰值点判别方法找到音频中每帧信号对应的傅里叶系数的峰值点频率段,作为计算能量段索引的起始点;
利用恒定的对数间隔计算能量段索引值;
利用能量段索引计算能量段值,并以二维过滤核过滤能量段提取指纹;
利用基于峰值点判别方法找到音频中每帧信号对应的傅里叶系数的峰值点频率段,作为计算能量段索引的起始点的步骤中,基于峰值点判别方法的步骤包括:
设定频率段位置阈值εfreq,用以决定每帧音频信号中峰值点的位置;
设定p表示每一帧峰值点所处的频率段,通过比较确定每一帧音频信号对应的傅里叶系数中具有最大傅里叶系数的频率段,即峰值点所在的频率段p,且该频率段的位置应位于频率段位置阈值εfreq规定的范围内;
利用恒定的对数间隔计算能量段索引值的步骤包括:
设定I(n)表示音频信号第n帧的能量段索引,将第n帧的p转化为对数,作为能量段索引I(n)的起始点,并逐次加以恒定的对数间隔d直至得到一定数量的能量段,将得到的能量段索引I(n)转化回与频率段对应的自然数值;
对音频信号的每一帧施以同样的前述操作得到音频信号的能量段索引;
利用能量段索引计算能量段值,并以二维过滤核过滤能量段提取指纹的步骤包括:
用能量段连续计算方法计算提取每帧子指纹依赖的能量段值;
用适配的二维过滤核提取指纹;
利用能量段连续计算方法计算每帧子指纹依赖的能量段值的步骤包括:
设定E(n,c,m)表示用能量段索引I(n)在第n帧音频信号对应的傅里叶系数上计算得到的第n帧第m段的能量段值,E(n,p,m)表示用能量段索引I(n)在第n-1帧音频信号对应的傅里叶系数上计算得到的第n帧第m段的能量段值;利用计算得到的能量段索引计算音频信号每一帧上的E(n,c,m)与E(n,p,m);
利用适配的二维过滤核提取指纹的步骤包括:
设定F(n,m)表示音频第n帧子指纹的第m位,利用计算得到的E(n,c,m)与E(n,p,m)根据如下公式提取F(n,m),有效组织后即为从音频内容中提取的指纹,公式表示为:
。
2.根据权利要求1所述的抗变调干扰的音频指纹提取方法,其特征在于,提取的音频指纹形式为0-1字符串的集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910833151.8/1.html,转载请声明来源钻瓜专利网。