[发明专利]实现音频文件重复模式发现的系统和方法有效
| 申请号: | 201310334235.X | 申请日: | 2013-08-02 |
| 公开(公告)号: | CN103440270A | 公开(公告)日: | 2013-12-11 |
| 发明(设计)人: | 吴及;吕萍;徐伟;何婷婷 | 申请(专利权)人: | 清华大学;安徽科大讯飞信息科技股份有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京汇智胜知识产权代理事务所(普通合伙) 11346 | 代理人: | 朱登河 |
| 地址: | 100084 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 实现 音频文件 重复 模式 发现 系统 方法 | ||
1.一种实现音频文件重复模式发现的系统,其特征在于,包括:
获取模块,用于获取各音频文件;
特征提取模块,用于从所述音频文件中提取音频比对特征;
匹配模块,用于基于所述音频比对特征依次两两匹配所述音频文件,得到两两匹配的重复音频片段;
合并模块,用于将在多个音频文件中均出现的重复音频片段进行合并,得到音频文件重复模式。
2.根据权利要求1所述的系统,其特征在于,所述特征提取模块包括:
降采样单元,用于对所述音频文件数据进行降采样;
矢量转化单元,用于将所述降采样后的数据量化为二进制的特征矢量序列。
3.根据权利要求2所述的系统,其特征在于,所述匹配模块包括:
粗匹配单元,用于基于所述音频比对特征对任意两个音频文件进行粗匹配,确定各重复子段的边界;
合并单元,用于在相邻的两个重复子段的长度均大于第一门限值,并且所述两个重复子段的间隔小于第二门限值时,将所述两个重复子段合并;
精确匹配模块,用于基于合并后的重复子段对所述两个音频文件进行精确匹配,得到所述两个音频文件的重复音频片段。
4.根据权利要求3所述的系统,其特征在于,所述粗匹配单元包括:
提取单元,用于依次提取其中一个音频文件的一帧音频比对特征;
查找单元,用于查找另一个音频文件中与提取的所述音频比对特征相同的匹配帧;
第一扩展单元,用于在所述查找单元查找到所述匹配帧后,分别对所述匹配帧及提取的音频比对特征所在帧进行前后扩展;
第一边界确定单元,用于在扩展后的时长内确定重复子段的边界。
5.根据权利要求3所述的系统,其特征在于,所述精确匹配单元包括:
第二扩展单元,用于对所述重复子段分别在两个音频文件中向上和向下扩展;
判断单元,用于计算在扩展的视窗内的比特错误率的平均得分,并且在所述平均得分小于设定值时,通知所述第二扩展单元停止扩展;
第二边界确定单元,用于在扩展的上、下视窗内分别确定所述两个音频文件的重复音频片段的上、下边界。
6.一种实现音频文件重复模式发现的方法,其特征在于,包括:
获取各音频文件;
从所述音频文件中提取音频比对特征;
基于所述音频比对特征依次两两匹配所述音频文件,得到两两匹配的重复音频片段;
将在多个音频文件中均出现的重复音频片段进行合并,得到音频文件重复模式。
7.根据权利要求6所述的方法,其特征在于,所述从各音频文件中提取音频特征包括:
对所述音频文件数据进行降采样;
将所述降采样后的数据量化为二进制的特征矢量序列。
8.根据权利要求7所述的方法,其特征在于,所述基于所述音频比对特征依次两两匹配所述音频文件,得到两两匹配的重复音频片段包括:
基于所述音频比对特征对任意两个音频文件进行粗匹配,确定各重复子段的边界;
如果相邻的两个重复子段的长度均大于第一门限值,并且所述两个重复子段的间隔小于第二门限值,则将所述两个重复子段合并;
基于合并后的重复子段对所述两个音频文件进行精确匹配,得到所述两个音频文件的重复音频片段。
9.根据权利要求8所述的方法,其特征在于,所述基于所述音频比对特征对任意两个音频文件进行粗匹配,确定各重复子段的边界包括:
依次提取其中一个音频文件的一帧音频比对特征;
查找另一个音频文件中与提取的所述音频比对特征相同的匹配帧;
查找到所述匹配帧后,分别对所述匹配帧及提取的音频比对特征所在帧进行前后扩展;
在扩展后的时长内确定重复子段的边界。
10.根据权利要求8所述的方法,其特征在于,所述基于合并后的重复子段对所述两个音频文件进行精确匹配,得到所述两个音频文件的重复音频片段包括:
对所述重复子段分别在两个音频文件中向上和向下扩展;
如果在扩展的视窗内的比特错误率的平均得分小于设定值,则停止扩展;
在扩展的上、下视窗内分别确定所述两个音频文件的重复音频片段的上、下边界。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;安徽科大讯飞信息科技股份有限公司,未经清华大学;安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310334235.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:自动抽真空装置及自动抽真空方法
- 下一篇:蝗虫微孢子雏蝗株系及其应用





