[发明专利]去相关稀疏映射音乐流派有监督自动分类方法有效

专利信息
申请号: 201110056483.3 申请日: 2011-03-09
公开(公告)号: CN102129456A 公开(公告)日: 2011-07-20
发明(设计)人: 关欣;徐星;李锵 申请(专利权)人: 天津大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 刘国威
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 相关 稀疏 映射 音乐 流派 监督 自动 分类 方法
【权利要求书】:

1.一种基于去相关稀疏映射音乐流派有监督自动分类方法,其特征是,包括下列步骤:

a建立有监督训练数据库;

b对训练音乐样本提取短时音乐特征和节奏特征,短时音乐特征即MFCC和音色特征;

c对提取的特征数据采用PCA(主分量分析)技术去噪和降维;

d将特征矩阵按流派类别分块,则A=[A1,A2,...,AK]为特征矩阵,K为音乐流派种类的个数,y为测试样本,求出方程y=Ax的最小一范数解。

e确定y的种类为arg mini||y-Aδi(x)i||2,i=1,2,...,k,δ(x)的非零值为第i类。

2.如权利要求1所述的方法,其特征是,所述的建立有监督训练数据库是通过相关渠道建立包括n种音乐流派的音乐文件夹,可以通过互联网下载或者专辑中获得,其中每一种音乐流派的数据库要尽可能包含不同的歌手,不同的专辑。

3.如权利要求1所述的方法,其特征是,在步骤b之前包括以下步骤:对输入的音乐文件截取两个30秒的片段;对截取每个30秒的片段,选取1秒为一个文本窗的长度,且文本窗与文本窗之间无重叠;对一个文本窗内选取512点为一个分析窗的长度,分析窗的帧移为256个样本点;对一个分析窗w的数据预加重、加窗、分帧;预加重包括:让输入的音乐文件通过滤波器,预加重滤波器一般是一阶的,形式如H(z)=1-uz-1,u的典型值在0.94~0.97之间;所加窗的窗函数类型为汉明窗(hamming);取帧长为512个样本点,帧移为256个样本点;提取MFCC特征需要设置相关参数的值,设置的参数包括:MFCC的通道为24,帧长为512个样本点,帧移为256个样本点,取前5维MFCC。

4.如权利要求1所述的方法,其特征是,所述的对训练音乐样本提取音色和节奏特征是用时域、频域和小波域的方法提取特征,其中时域特征:zero-crossing-rate和Low-energy;频域特征:spectral-power,spectral-rolloff,spectral-centroid,spectral-fulx,spectral-spread,spectral-skewness,spectral-kurtosis,spectral-brightness,spectral-entropy,spectral-irrgularity,spectral-low-energy,spectral-flatness及MFCC。小波域特征:beat histogram、DWCH,其中:

首先定义,xk=abs(fft(x)),下面公式中所涉及N为一个分析窗内的样本点的个数,即512点。

Spectral-power:数学定义如下:

s=10lg(xk)

spectral-rolloff:是衡量频谱波形的一种方式,数学公式定义如下:

R={R|Σn=1RMt[n]=0.85*Σn=1NMt[n]}]]>

spectral-centroid:定义为频谱能量的一阶矩,数学定义公式如下

spectral-centroid=Σi=0Nfip(fi)Σi=0Np(fi)]]>

spectral-fulx:表征两个相邻的帧频谱的连续变化情况,数学定义,

spectral-flux=Σn=1N(Nt(n)-Nt(n-1))2]]>

spectral-spread:为频谱能量的二阶中心距,数学公式为

spectral-spread=∫(x-scentroid)2f(x)dx

spectral-skewness:定义为频谱能量的三阶矩,数学公式为

spectral-skewness=Σi=0N-1(p(fi-scnetroid))33]]>

spectral-kurtosis:定义为频谱能量的四阶矩,数学公式为

spectral-kurtosis=u4σ4-3]]>

spectral-brightness:描述的是大于某个频率阈值之后的能量之和,典型频率门限值是1500Hz,

spectral-entropy:反应的是频谱能量的信息熵,香农公式(shannon)如下,

spectral-entropy=-Σi=0Np(xi)log2p(xi)]]>

spectral-irrgularity:反应的是频谱能量波形波峰的变化程度,有两种形式,数学公式如下

(a)jensen

spectral-irregularity=Σk=0N-1(ak-ak+1)2Σk=0N1ak2]]>

(b)krimpboff

spectral-irregularity=Σk=2N-1|ak-ak-1+ak+ak+13|]]>

spectral-low-energy:类似于时域low energy

spectral-flatness:反应的是频谱能量波形分布的平滑程度,数学公式如下,

spectral-flatness=NΠn=0N-1xk(n)1NΣn=0N-1xk(n);]]>

beat histogram为拍子图;

DWCH:描述的是基于Daubechies(db8)滤波器,对音乐样本做小波变换,然后提取小波系数的统计特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110056483.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top