[发明专利]实现音频文件重复模式发现的系统和方法有效
| 申请号: | 201310334235.X | 申请日: | 2013-08-02 |
| 公开(公告)号: | CN103440270A | 公开(公告)日: | 2013-12-11 |
| 发明(设计)人: | 吴及;吕萍;徐伟;何婷婷 | 申请(专利权)人: | 清华大学;安徽科大讯飞信息科技股份有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京汇智胜知识产权代理事务所(普通合伙) 11346 | 代理人: | 朱登河 |
| 地址: | 100084 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 实现 音频文件 重复 模式 发现 系统 方法 | ||
技术领域
本发明涉及音频处理技术领域,具体涉及一种实现音频文件重复模式发现的系统和方法。
背景技术
随着通讯技术和互联网技术的发展,越来越多的音频数据出现在人们的日常生活中。和文本数据不同,音频数据是非符号化的信号数据,对其处理也更为困难。音频信号处理在信息安全和舆情监控应用中有着非常重要的应用价值,特别是从海量音频数据中自动发现频繁出现的音频片段,即音频文件重复发现,有实际意义。对电话类音频数据,利用该技术可以快速发现正在传播的非法电话录音。而对互联网音视频数据,利用该技术可以快速准确地挖掘出目前最流行的音视频片段。进一步地,通过音频文件重复模式发现技术可获得重复音频模板库,便于利用所述音频模板匹配技术检测新增音频文件中是否包含模板库中的音频片段,实现快速定位确认,及时了解音频模板库中的音频模板在电话网或互联网上的传播情况。
现有的重复模式发现技术只能处理符号化数据的重复子集发现问题,对信号级别的音频数据没有可以使用的有效方案。
发明内容
本发明实施例提供一种实现音频文件重复模式发现的系统和方法,以解决在海量音频库中重复片段自动搜索的问题。
为此,本发明提供如下技术方案:
一种实现音频文件重复模式发现的系统,包括:
获取模块,用于获取各音频文件;
特征提取模块,用于从所述音频文件中提取音频比对特征;
匹配模块,用于基于所述音频比对特征依次两两匹配所述音频文件,得到两两匹配的重复音频片段;
合并模块,用于将在多个音频文件中均出现的重复音频片段进行合并,得到音频文件重复模式。
优选地,所述特征提取模块包括:
降采样单元,用于对所述音频文件数据进行降采样;
矢量转化单元,用于将所述降采样后的数据量化为二进制的特征矢量序列。
优选地,所述匹配模块包括:
粗匹配单元,用于基于所述音频比对特征对任意两个音频文件进行粗匹配,确定各重复子段的边界;
合并单元,用于在相邻的两个重复子段的长度均大于第一门限值,并且所述两个重复子段的间隔小于第二门限值时,将所述两个重复子段合并;
精确匹配模块,用于基于合并后的重复子段对所述两个音频文件进行精确匹配,得到所述两个音频文件的重复音频片段。
优选地,所述粗匹配单元包括:
提取单元,用于依次提取其中一个音频文件的一帧音频比对特征;
查找单元,用于查找另一个音频文件中与提取的所述音频比对特征相同的匹配帧;
第一扩展单元,用于在所述查找单元查找到所述匹配帧后,分别对所述匹配帧及提取的音频比对特征所在帧进行前后扩展;
第一边界确定单元,用于在扩展后的时长内确定重复子段的边界。
优选地,所述精确匹配单元包括:
第二扩展单元,用于对所述重复子段分别在两个音频文件中向上和向下扩展;
判断单元,用于计算在扩展的视窗内的比特错误率的平均得分,并且在所述平均得分小于设定值时,通知所述第二扩展单元停止扩展;
第二边界确定单元,用于在扩展的上、下视窗内分别确定所述两个音频文件的重复音频片段的上、下边界。
一种实现音频文件重复模式发现的方法,包括:
获取各音频文件;
从所述音频文件中提取音频比对特征;
基于所述音频比对特征依次两两匹配所述音频文件,得到两两匹配的重复音频片段;
将在多个音频文件中均出现的重复音频片段进行合并,得到音频文件重复模式。
优选地,所述从各音频文件中提取音频特征包括:
对所述音频文件数据进行降采样;
将所述降采样后的数据量化为二进制的特征矢量序列。
优选地,所述基于所述音频比对特征依次两两匹配所述音频文件,得到两两匹配的重复音频片段包括:
基于所述音频比对特征对任意两个音频文件进行粗匹配,确定各重复子段的边界;
如果相邻的两个重复子段的长度均大于第一门限值,并且所述两个重复子段的间隔小于第二门限值,则将所述两个重复子段合并;
基于合并后的重复子段对所述两个音频文件进行精确匹配,得到所述两个音频文件的重复音频片段。
优选地,所述基于所述音频比对特征对任意两个音频文件进行粗匹配,确定各重复子段的边界包括:
依次提取其中一个音频文件的一帧音频比对特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;安徽科大讯飞信息科技股份有限公司,未经清华大学;安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310334235.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:自动抽真空装置及自动抽真空方法
- 下一篇:蝗虫微孢子雏蝗株系及其应用





