[发明专利]去相关稀疏映射音乐流派有监督自动分类方法有效
| 申请号: | 201110056483.3 | 申请日: | 2011-03-09 |
| 公开(公告)号: | CN102129456A | 公开(公告)日: | 2011-07-20 |
| 发明(设计)人: | 关欣;徐星;李锵 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 刘国威 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 相关 稀疏 映射 音乐 流派 监督 自动 分类 方法 | ||
1.一种基于去相关稀疏映射音乐流派有监督自动分类方法,其特征是,包括下列步骤:
a建立有监督训练数据库;
b对训练音乐样本提取短时音乐特征和节奏特征,短时音乐特征即MFCC和音色特征;
c对提取的特征数据采用PCA(主分量分析)技术去噪和降维;
d将特征矩阵按流派类别分块,则A=[A1,A2,...,AK]为特征矩阵,K为音乐流派种类的个数,y为测试样本,求出方程y=Ax的最小一范数解。
e确定y的种类为arg mini||y-Aδi(x)i||2,i=1,2,...,k,δ(x)的非零值为第i类。
2.如权利要求1所述的方法,其特征是,所述的建立有监督训练数据库是通过相关渠道建立包括n种音乐流派的音乐文件夹,可以通过互联网下载或者专辑中获得,其中每一种音乐流派的数据库要尽可能包含不同的歌手,不同的专辑。
3.如权利要求1所述的方法,其特征是,在步骤b之前包括以下步骤:对输入的音乐文件截取两个30秒的片段;对截取每个30秒的片段,选取1秒为一个文本窗的长度,且文本窗与文本窗之间无重叠;对一个文本窗内选取512点为一个分析窗的长度,分析窗的帧移为256个样本点;对一个分析窗w的数据预加重、加窗、分帧;预加重包括:让输入的音乐文件通过滤波器,预加重滤波器一般是一阶的,形式如H(z)=1-uz-1,u的典型值在0.94~0.97之间;所加窗的窗函数类型为汉明窗(hamming);取帧长为512个样本点,帧移为256个样本点;提取MFCC特征需要设置相关参数的值,设置的参数包括:MFCC的通道为24,帧长为512个样本点,帧移为256个样本点,取前5维MFCC。
4.如权利要求1所述的方法,其特征是,所述的对训练音乐样本提取音色和节奏特征是用时域、频域和小波域的方法提取特征,其中时域特征:zero-crossing-rate和Low-energy;频域特征:spectral-power,spectral-rolloff,spectral-centroid,spectral-fulx,spectral-spread,spectral-skewness,spectral-kurtosis,spectral-brightness,spectral-entropy,spectral-irrgularity,spectral-low-energy,spectral-flatness及MFCC。小波域特征:beat histogram、DWCH,其中:
首先定义,xk=abs(fft(x)),下面公式中所涉及N为一个分析窗内的样本点的个数,即512点。
Spectral-power:数学定义如下:
s=10lg(xk)
spectral-rolloff:是衡量频谱波形的一种方式,数学公式定义如下:
spectral-centroid:定义为频谱能量的一阶矩,数学定义公式如下
spectral-fulx:表征两个相邻的帧频谱的连续变化情况,数学定义,
spectral-spread:为频谱能量的二阶中心距,数学公式为
spectral-spread=∫(x-scentroid)2f(x)dx
spectral-skewness:定义为频谱能量的三阶矩,数学公式为
spectral-kurtosis:定义为频谱能量的四阶矩,数学公式为
spectral-brightness:描述的是大于某个频率阈值之后的能量之和,典型频率门限值是1500Hz,
spectral-entropy:反应的是频谱能量的信息熵,香农公式(shannon)如下,
spectral-irrgularity:反应的是频谱能量波形波峰的变化程度,有两种形式,数学公式如下
(a)jensen
(b)krimpboff
spectral-low-energy:类似于时域low energy
spectral-flatness:反应的是频谱能量波形分布的平滑程度,数学公式如下,
beat histogram为拍子图;
DWCH:描述的是基于Daubechies(db8)滤波器,对音乐样本做小波变换,然后提取小波系数的统计特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110056483.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种混凝土裂缝扩展仿真方法
- 下一篇:域名匹配方法、浏览器





