[发明专利]去相关稀疏映射音乐流派有监督自动分类方法有效
| 申请号: | 201110056483.3 | 申请日: | 2011-03-09 |
| 公开(公告)号: | CN102129456A | 公开(公告)日: | 2011-07-20 |
| 发明(设计)人: | 关欣;徐星;李锵 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 刘国威 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 相关 稀疏 映射 音乐 流派 监督 自动 分类 方法 | ||
技术领域
本发明涉及音频信号处理,具体讲涉及去相关稀疏映射音乐流派有监督自动分类方法。
背景技术
当今数字化与网络时代化,数据存储技术和多媒体压缩技术如JPEG、MPEG等技术的快速发展,导致数字多媒体数据的存储量增加,也导致互联网上音频数据的增加。目前,图像、音频和视频等多媒体内容已成为互联网信息高速公路上所传送数据的主要部分,而音乐又是音频的主要部分,随着互联网的发展,越来越多的人能够更加方便、快捷、经济地接触到数字音乐,人们面临的问题不再是缺少媒体内容,而是如何在浩如烟海的多媒体世界中找到自己所需要的信息。音乐流派是人类创造的用于区分和描述音乐,然而由于历史和文化等原因音乐流派没有严格的定义与界限,每一种音乐流派的特征都是由其成员的特征决定的,这些特征又是由乐器,节奏和音乐的和声决定的。目前音乐流派的分类是靠人工完成的,当面对网络上海量的音乐时,人工分类不足以完成如此巨大的工作量,这时需要借助计算机、人工智能等以取代人工分类,实现音乐流派的自动分类。
目前,在现有的基于音乐内容的专利中,大多是基于音乐内容的音乐检索。2009年4月1日公布的、公开号为CN101398825、名称为用于快速音乐分类和检索的方法和设备的中国发明专利申请公布说明书提供了一种基于内容的音乐分类方法,该专利提取短时音乐特征,即MFCC和音质特征,采用基于支持向量机(SVM)进行分类。
近年来,基于最小一范数稀疏映射已经成功应用于模式识别与分类,在医学领域癌症与肿瘤的分类、人脸识别、卫星图像分类、说话人识别和种子分类方面取得了较好的分类效果。
目前未发现基于最小一范数稀疏映射用于音乐流派有监督自动分类的报道。
发明内容
为克服现有技术的不足,提供一种能够提高音乐流派自动分类准确率,方便音乐音频数据库内容组织和检索,也可用于其它基于内容音乐信息检索,提高检索性能的基于最小一范数稀疏映射的音乐流派有监督自动分类方法及系统,本发明采用的技术方案是,一种去相关稀疏映射音乐流派有监督自动分类方法,包括下列步骤:
a建立有监督训练数据库;
b对训练音乐样本提取短时音乐特征和节奏特征,短时音乐特征即MFCC和音色特征;
c对提取的特征数据采用PCA(主分量分析)技术去噪和降维;
d将特征矩阵按流派类别分块,则A=[A1,A2,...,AK]为特征矩阵,K为音乐流派种类的个数,y为测试样本,求出方程y=Ax的最小一范数解。
e确定y的种类为argmini||y-Aδi(x)i||2,i=1,2,...,k,δ(x)的非零值为第i类。
所述的建立有监督训练数据库是通过相关渠道建立包括n种音乐流派的音乐文件夹,可以通过互联网下载或者专辑中获得,其中每一种音乐流派的数据库要尽可能包含不同的歌手,不同的专辑。
所述在步骤b之前包括以下步骤:对输入的音乐文件截取两个30秒的片段;对截取每个30秒的片段,选取1秒为一个文本窗的长度,且文本窗与文本窗之间无重叠;对一个文本窗内选取512点为一个分析窗的长度,分析窗的帧移为256个样本点;对一个分析窗w的数据预加重、加窗、分帧;预加重包括:让输入的音乐文件通过滤波器,预加重滤波器一般是一阶的,形式如H(z)=1-uz-1,u的典型值在0.94~0.97之间;所加窗的窗函数类型为汉明窗(hamming);取帧长为512个样本点,帧移为256个样本点;提取美尔频率倒谱系数(MFCC)特征需要设置相关参数的值,设置的参数包括:MFCC的通道为24,帧长为512个样本点,帧移为256个样本点,取前5维MFCC。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110056483.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种混凝土裂缝扩展仿真方法
- 下一篇:域名匹配方法、浏览器





