[发明专利]一种抗变调干扰的音频指纹提取方法有效
| 申请号: | 201910833151.8 | 申请日: | 2019-09-04 |
| 公开(公告)号: | CN110767248B | 公开(公告)日: | 2022-03-22 |
| 发明(设计)人: | 褚仁杰;牛保宁;姚姗姗 | 申请(专利权)人: | 太原理工大学 |
| 主分类号: | G10L25/18 | 分类号: | G10L25/18;G10L25/54;G10L21/14;G06F16/61;G06F16/683 |
| 代理公司: | 太原晋科知识产权代理事务所(特殊普通合伙) 14110 | 代理人: | 任林芳 |
| 地址: | 030024 *** | 国省代码: | 山西;14 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 变调 干扰 音频 指纹 提取 方法 | ||
本发明公开了一种抗变调干扰的音频指纹提取方法,该方法的步骤包括:对音频信号分帧加窗,做傅里叶变换,收集每帧信号对应的傅里叶系数;在收集到的傅里叶系数中,用基于峰值点的能量段索引计算方法计算每帧信号对应的能量段索引;利用能量段索引计算能量段值,并以二维过滤核过滤能量段提取指纹。通过本发明,能够克服现有飞利浦指纹无法抵抗变调干扰的不足,在保持原飞利浦指纹的子指纹连续性和对各种噪声干扰鲁棒的前提下,增加对变调干扰的抵抗性。
技术领域
本发明涉及音频信息检索领域,特别是涉及一种抗变调干扰的音频指纹提取方法。
背景技术
随着信息电子技术与移动互联网在全世界范围的广泛发展、音频编解码技术的迅猛发展以及高容量存储介质的诞生,网络中的数字音频资源数量呈现指数级别的增长。海量的网络数字音频资源给人们带来极大便利的同时,对于其网络版权保护也随着现阶段互联网数字音频管理体系和版权保护制度的发展而逐渐引起重视。为了对网络用户随意上传或下载的数字音频资源与更改后的音频内容进行版权监控,保护数字音频资源版权拥有者的合法权益,需要音频检索技术。
目前主要的音频检索方法分为基于文本和基于内容两大类,在版权监控及其它如听歌识曲等应用中主要依赖基于内容的音频检索方法。基于内容的音频指纹检索是将待检索音频指纹与音频指纹数据库中的指纹进行相似度匹配,通过比较相似度获取检索结果的过程。
音频指纹是检索准确与高效的基础。提取的指纹需有强代表性,高区分性与高鲁棒性,但是目前没有一种音频指纹对所有类型的噪音干扰都鲁棒。飞利浦(Philips)指纹与沙赞(Shazam)指纹是音频指纹的两类代表。在对飞利浦指纹改进时多基于改变提取指纹所依据的信息,原指纹无法抵抗大于±4%的变速干扰,Joe等人利用傅里叶变换的相位信息将这一范围提高到±10%。这是类飞利浦指纹的常见问题。在对沙赞指纹改进时,多是考虑利用峰值点的变换不变性组合形成指纹,Quads指纹是其中的代表,可以抵抗极其严重的变速干扰,但在GSM压缩干扰下表现不佳。
随着大数据时代的到来,音频指纹检索方法中检索方法在应对大规模音频数据时需要保持检索高效与精确。增强型采样技术方法(enhanced Sampling and Counting,eSC)是为类飞利浦指纹提出的高效的检索方法。eSC通过在过滤阶段对音频子指纹采样和对匹配对计数取得高效性,快速过滤掉大部分不相关的音频,得到一个比原始数据库小很多的候选音频集;在精确匹配阶段采用转折点匹配方法进行待检索音频与候选集音频的配对,获得对变速干扰中时间延展干扰的抵抗性,但是仍然没有解决飞利浦指纹弱变调干扰的缺点。
发明内容
本发明主要为解决现有技术的不足之处而提供一种抗变调干扰的音频指纹提取方法。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种抗变调干扰的音频指纹提取方法,该方法的步骤包括:对音频信号分帧加窗,做傅里叶变换,收集每帧信号对应的傅里叶系数;在收集到的傅里叶系数中,用基于峰值点的能量段索引计算方法计算每帧信号对应的能量段索引;利用能量段索引计算能量段值,并以二维过滤核过滤能量段提取指纹。
其中,用基于峰值点的能量段索引计算方法计算每帧信号对应的能量段索引的步骤包括:利用峰值点判别方法找到音频中每帧信号对应的傅里叶系数的峰值点频率段,作为计算能量段索引的起始点;利用恒定的对数间隔计算能量段索引值。
其中,利用基于峰值点判别方法找到音频中每帧信号对应的傅里叶系数的峰值点频率段,作为计算能量段索引的起始点的步骤中,基于峰值点判别方法的步骤包括:
设定频率段位置阈值εfreq用以决定每帧音频信号中峰值点的位置;设定p表示每一帧峰值点所处的频率段,通过比较确定每一帧音频信号对应的傅里叶系数中具有最大傅里叶系数的频率段,即峰值点所在的频率段p,且该频率段的位置应位于频率段位置阈值εfreq规定的范围内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910833151.8/2.html,转载请声明来源钻瓜专利网。





