[发明专利]一种拖拽音频文件进行音频文件信息检索的方法和装置有效

申请号：	201310169150.0	申请日：	2013-05-09
公开（公告）号：	CN104077336A	公开（公告）日：	2014-10-01
发明（设计）人：	陈剑锋;李深远;赵伟峰;张李伟	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06F17/30	分类号：	G06F17/30;G06F3/0486
代理公司：	北京品源专利代理有限公司 11332	代理人：	马晓亚
地址：	518044 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种音频文件进行信息检索方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种拖拽音频文件进行音频文件信息检索的方法，其特征在于，所述方法包括：

检测作用于所述音频文件的拖拽操作；

根据所述拖拽操作，获取所述音频文件的音频信号；

对所述音频信号进行分帧处理，生成至少一个音频分帧；

利用起始点检测算法（ODF）确定所述至少一个音频分帧中的关键帧；

提取所述关键帧的音频指纹；

利用所述音频指纹在音频指纹数据库中进行检索，获得与所述音频指纹相对应的音频文件的信息。

2.根据权利要求1所述的拖拽音频文件进行音频文件信息检索的方法，其特征在于，所述根据所述拖拽操作获取所述音频文件的音频信号的步骤包括：获取由于所述拖拽操作而移动的所述音频文件的当前位置；判断所述当前位置是否落入预设的拖拽处理控件区域；在所述判断的结果为是的情况下，对所述音频文件进行频谱解析，从而生成音频信号。

3.根据权利要求1所述的拖拽音频文件进行音频文件信息检索的方法，其特征在于，所述对所述音频信号进行分帧处理生成至少一个音频分帧的步骤包括：按照预定时间间隔从所述音频信号中提取固定时间长度的频谱图分段，从而得到至少一个音频分帧。

4.根据权利要求1所述的拖拽音频文件进行音频文件信息检索的方法，其特征在于，所述利用起始点检测算法（ODF）确定所述至少一个音频分帧中的关键帧包括：对所述至少一个音频分帧中的各音频分帧进行快速傅里叶变换（FFT）；提取所述各音频分帧的ODF特征参数；根据所述ODF特征参数确定所述各音频分帧中的关键帧。

5.根据权利要求4所述的拖拽音频文件进行音频文件信息检索的方法，其特征在于，所述根据所述ODF特征参数确定所述各音频分帧中的关键帧包括：将所述ODF特征参数满足预设ODF阈值条件的音频分帧确定为关键帧。

6.根据权利要求4-5之一所述的拖拽音频文件进行音频文件信息检索的方法，其特征在于，所述提取所述各音频分帧的ODF特征参数，通过以下算法中的一种算法或一种以上的算法的组合来实现：

能量算法、差分相位算法、高频分量算法、改进的库尔贝克和莱伯勒散度算法、美尔倒谱系数、线谱对和加权相位差分。

7.根据权利要求1所述的拖拽音频文件进行音频文件信息检索的方法，其特征在于，所述提取所述关键帧的音频指纹包括：基于离散余弦变换（DCT）和最小哈希算法得到所述关键帧的音频指纹。

8.根据权利要求7所述的拖拽音频文件进行音频文件信息检索的方法，其特征在于，所述基于离散余弦变换（DCT）和最小哈希算法得到所述关键帧的音频指纹，包括：对所述关键帧进行短时的DCT，并保留部分DCT系数；将所保留的DCT系数采用二进制表示；采用最小哈希算法将采用二进制表示的DCT系数转换为音频指纹。

9.根据权利要求1所述的拖拽音频文件进行音频文件信息检索的方法，其特征在于，所述音频指纹数据库包括音频指纹和与所述音频指纹相关联存储的音频文件的信息。

10.一种拖拽音频文件进行音频文件信息检索的装置，其特征在于，所述装置包括：

检测模块，用于检测作用于所述音频文件的拖拽操作；

音频信号获取模块，用于根据所述拖拽操作获取所述音频文件的音频信号；

分帧处理模块，用于对所述音频信号进行分帧处理，生成至少一个音频分帧；

关键帧确定模块，用于利用起始点检测算法（ODF）确定所述至少一个音频分帧中的关键帧；

音频指纹提取模块，用于提取所述关键帧的音频指纹；

检索模块，用于利用所述音频指纹在音频指纹数据库中进行检索，获得与所述音频指纹相对应的音频文件的信息。

11.根据权利要求10所述的拖拽音频文件进行音频文件信息检索的装置，其特征在于，所述音频信号获取模块包括：获取由于所述拖拽操作而移动的所述音频文件的当前位置；判断所述当前位置是否落入预设的拖拽处理控件区域；在所述判断的结果为是的情况下，对所述音频文件进行频谱解析，从而生成音频信号。

12.根据权利要求10所述的拖拽音频文件进行音频文件信息检索的装置，其特征在于，所述分帧处理模块包括：按照预定时间间隔从所述音频信号中提取固定时间长度的频谱图分段，从而得到至少一个音频分帧。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载