[发明专利]实现音频文件重复模式发现的系统和方法有效

申请号：	201310334235.X	申请日：	2013-08-02
公开（公告）号：	CN103440270A	公开（公告）日：	2013-12-11
发明（设计）人：	吴及;吕萍;徐伟;何婷婷	申请（专利权）人：	清华大学;安徽科大讯飞信息科技股份有限公司
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	北京汇智胜知识产权代理事务所(普通合伙) 11346	代理人：	朱登河
地址：	100084 北京***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	实现音频文件重复模式发现系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及音频处理技术领域，具体涉及一种实现音频文件重复模式发现的系统和方法。

背景技术

随着通讯技术和互联网技术的发展，越来越多的音频数据出现在人们的日常生活中。和文本数据不同，音频数据是非符号化的信号数据，对其处理也更为困难。音频信号处理在信息安全和舆情监控应用中有着非常重要的应用价值，特别是从海量音频数据中自动发现频繁出现的音频片段，即音频文件重复发现，有实际意义。对电话类音频数据，利用该技术可以快速发现正在传播的非法电话录音。而对互联网音视频数据，利用该技术可以快速准确地挖掘出目前最流行的音视频片段。进一步地，通过音频文件重复模式发现技术可获得重复音频模板库，便于利用所述音频模板匹配技术检测新增音频文件中是否包含模板库中的音频片段，实现快速定位确认，及时了解音频模板库中的音频模板在电话网或互联网上的传播情况。

现有的重复模式发现技术只能处理符号化数据的重复子集发现问题，对信号级别的音频数据没有可以使用的有效方案。

发明内容

本发明实施例提供一种实现音频文件重复模式发现的系统和方法，以解决在海量音频库中重复片段自动搜索的问题。

为此，本发明提供如下技术方案：

一种实现音频文件重复模式发现的系统，包括：

获取模块，用于获取各音频文件；

特征提取模块，用于从所述音频文件中提取音频比对特征；

匹配模块，用于基于所述音频比对特征依次两两匹配所述音频文件，得到两两匹配的重复音频片段；

合并模块，用于将在多个音频文件中均出现的重复音频片段进行合并，得到音频文件重复模式。

优选地，所述特征提取模块包括：

降采样单元，用于对所述音频文件数据进行降采样；

矢量转化单元，用于将所述降采样后的数据量化为二进制的特征矢量序列。

优选地，所述匹配模块包括：

粗匹配单元，用于基于所述音频比对特征对任意两个音频文件进行粗匹配，确定各重复子段的边界；

合并单元，用于在相邻的两个重复子段的长度均大于第一门限值，并且所述两个重复子段的间隔小于第二门限值时，将所述两个重复子段合并；

精确匹配模块，用于基于合并后的重复子段对所述两个音频文件进行精确匹配，得到所述两个音频文件的重复音频片段。

优选地，所述粗匹配单元包括：

提取单元，用于依次提取其中一个音频文件的一帧音频比对特征；

查找单元，用于查找另一个音频文件中与提取的所述音频比对特征相同的匹配帧；

第一扩展单元，用于在所述查找单元查找到所述匹配帧后，分别对所述匹配帧及提取的音频比对特征所在帧进行前后扩展；

第一边界确定单元，用于在扩展后的时长内确定重复子段的边界。

优选地，所述精确匹配单元包括：

第二扩展单元，用于对所述重复子段分别在两个音频文件中向上和向下扩展；

判断单元，用于计算在扩展的视窗内的比特错误率的平均得分，并且在所述平均得分小于设定值时，通知所述第二扩展单元停止扩展；

第二边界确定单元，用于在扩展的上、下视窗内分别确定所述两个音频文件的重复音频片段的上、下边界。

一种实现音频文件重复模式发现的方法，包括：

获取各音频文件；

从所述音频文件中提取音频比对特征；

基于所述音频比对特征依次两两匹配所述音频文件，得到两两匹配的重复音频片段；

将在多个音频文件中均出现的重复音频片段进行合并，得到音频文件重复模式。

优选地，所述从各音频文件中提取音频特征包括：

对所述音频文件数据进行降采样；

将所述降采样后的数据量化为二进制的特征矢量序列。

优选地，所述基于所述音频比对特征依次两两匹配所述音频文件，得到两两匹配的重复音频片段包括：

基于所述音频比对特征对任意两个音频文件进行粗匹配，确定各重复子段的边界；

如果相邻的两个重复子段的长度均大于第一门限值，并且所述两个重复子段的间隔小于第二门限值，则将所述两个重复子段合并；

基于合并后的重复子段对所述两个音频文件进行精确匹配，得到所述两个音频文件的重复音频片段。

优选地，所述基于所述音频比对特征对任意两个音频文件进行粗匹配，确定各重复子段的边界包括：

依次提取其中一个音频文件的一帧音频比对特征；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于清华大学;安徽科大讯飞信息科技股份有限公司，未经清华大学;安徽科大讯飞信息科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201310334235.X/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]实现音频文件重复模式发现的系统和方法有效

专利文献下载