[发明专利]一种基于MFCCM的音频数据检索方法无效
| 申请号: | 200810070557.7 | 申请日: | 2008-01-29 |
| 公开(公告)号: | CN101226558A | 公开(公告)日: | 2008-07-23 |
| 发明(设计)人: | 李应 | 申请(专利权)人: | 福州大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 福州元创专利代理有限公司 | 代理人: | 蔡学俊 |
| 地址: | 350002*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 mfccm 音频 数据 检索 方法 | ||
技术领域
本发明属于多媒体数据检索、处理技术,特别涉及音频数据分析、索引、搜索和检索技术。
背景技术
媒体音频数据,已经成为网络、信息时代信息的重要组成部分。如何对各种音频数据进行分类、搜索、索引和检索已经成为音频数据广泛应用的瓶颈。因此,音频数据的分类、识别、自动检索、智能浏览、基于内容的检索和基于音频信号对视频数据进行检索等引起广泛的研究。这类研究一般通过对声音的分析来产生各种特征,通过特征来实现搜索和检索声音(Wold et al.1996)。其中,经常使用的特征包括音频信号的短时离散傅立叶变换、短时自相关序列、倒谱系数、Mel频率倒谱系数、谱质心(Spectral)、谱衰减(Spectral Roll-off)、谱通量(Spectral Flux)、基频(Fundamental Frequency)、过零率(Zero-Crossing Rate)和能量(Rate)等。
这些特征可以作为视听数据内容分析的主要部分(Wand et al.2000)。同样,Zhang etal.(2001)通过对这些特征的分析来确定语音、音乐、歌声、环境声音、带音乐背景的语音、带音乐背景的环境声、静音等,从而实现视听数据的自动分段和分类。Cristani et al.(2007)则利用这些特征,实现视听数据自动场景分析和理解。
对于音乐数据的检索,Pikrakis et al.(2003,2006)通过分析特征序列的相邻频率突变的相关性,实现音乐的自动分析和用变时HMM分类音乐。Pinquier et al.(2006)根据熵和稳定分段的时延,实现多媒体文件的语音和音乐轨迹检索。Fragoulis et al.(2001)通过对各种特征的分析,判定音乐录音的失真和不正常部分。Clausen et al.(2004)通过音乐通用特征的分析,实现音乐检索、失真容忍度分析。
对于各种综合音频数据的检索,目前,人们也进行了广泛的研究。根据音频的特征,确定语音和非语音声音,再通过神经网络来确定非语音音频的类型(Ahmad et al.2006)。基于音频数据的特征,对音频数据进行基于内容的音频两阶段分段,来研究音频数据的分类和检索(Zhang et al.2006)。根据人类的听觉特性,判断语音性别,对枪声、汽车声等音频内容进行分类(Harb et al.2007)。用音频数据的特征,研究各种音频数据分类和检索的通用框架、研究模糊层次分类和全局分段框架,把音频数据分成语音、音乐、模糊和静音(Kiranyazet al.2006)。用音频数据的多特征向量,研究基于内容的音频数据检索(Kim et al.2006)。用支持向量机的加权因子和Euclidean距离来研究音频数据的分类(Chung et al.2007)。基于最小描述长度的高斯模型实现音频流分段和分类(Wu et al.2006)。通过认知最小变异失真响应、平滑过零率、临界带对数能量系数,用加权高斯马尔可夫模型网络,实现无监督分类分段(Rongqing et al.2006)等。
这些方法普遍存在算法复杂,检索效率和检索精度偏低的问题。
发明内容
本发明的目的在于克服现有方法中存在的检索效率和检索精度的问题,为多媒体数据检索、处理,音频数据分析、索引、搜索和检索提供一种高效率和高精度的方法。
本发明的目的是通过如下措施来达到:
1、构建MFCCM
把一个音频数据文件的每个帧的MFCC,作为矩阵的行,按顺序组成的矩阵就是MFCCM,它可以表示为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810070557.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





