[发明专利]一种弦乐器演奏音质自动判别方法有效
申请号: | 201610066930.6 | 申请日: | 2016-01-29 |
公开(公告)号: | CN105719661B | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 管晓宏;杜友田;丁梦莹;雷喆 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/18;G10L25/24 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 段俊涛 |
地址: | 710049*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 弦乐器 演奏 音质 自动 判别 方法 | ||
1.一种弦乐器演奏音质自动判别方法,包括如下步骤:
首先,对乐器类型及其演奏模式进行自动识别;
其次,针对乐器的类型和演奏模式,提取乐器演奏的动态和静态特征;
最后,将提取的特征作为输入,以随机森林模型为分类器,进行训练和分类,并对结果进行连续化处理;
所述乐器类型自动识别的方法如下:
1)提取用以描述乐器类型的3种音频特征
a)每一帧的频谱重心G
其中,m为窗宽,fn为声音的n次谐波频率,即音频信号经离散傅立叶变换(DFT)后第n个点处代表的频率,An为fn所对应的振幅,通过滑动窗的滑动得到一系列频谱重心,计算其最大值GM、最小值Gmin、均值Ge和标准差Gs;
b)上升时间Tr
Tr=Tstb-T0
Tstb为一段音频中时域幅值稳定的时刻,T0为演奏发声的起始时间,即音频的开始时刻;
c)倒谱系数
分别对上升时间和稳定时间对应的音频,以窗宽m的滑动窗和Δm的重叠率进行分帧,并使用Levinson-Durbin算法,计算每帧音频的11维LPC系数,并将该系数转换为倒谱系数,其中Δm选择为0.25或0.5;
2)乐器类型分类
将以上3种音频特征串联起来形成16维的特征向量,对特征向量进行识别,输出结果为乐器类型,即分为击弦类乐器和拉弦类乐器;
其特征在于,所述演奏模式自动识别的方法如下:在频谱重心、上升时间和倒谱系数的基础上,加入信噪比SNR;将组合而得的18维特征作为高斯分类器的输入,进行训练,输出结果为柔和模式、高噪声模式和普通模式。
2.根据权利要求1所述弦乐器演奏音质自动判别方法,其特征在于,所述倒谱系数提取过程中,使用Levinson-Durbin算法,计算每帧音频的11维LPC系数,并将该系数转换为倒谱系数的过程是:
式中CLPCC为线性预测倒谱系数,CLPC为线性预测系数,z为预测系数的序号,k为求和运算中每次迭代所取的点数序号。
3.根据权利要求1所述弦乐器演奏音质自动判别方法,其特征在于,所述乐器类型分类过程中,采用贝叶斯分类器对特征向量进行识别。
4.根据权利要求1所述弦乐器演奏音质自动判别方法,其特征在于,所述信噪比SNR的获取方法为:使用快速独立成分分析算法提取噪声,对音频信号进行归一化和白化,以下两公式作为核心迭代公式进行迭代:
W*=E{Xg(WTX)}-E{g′(WTX)}W
W=W*/||W*||
其中,X为原始音频信号,W的初始值为n维随机矩阵,n表示需要分离的独立随机变量个数,E{·}为均值运算,g(·)为非线性函数,取g(y)=tanh(y)、或y3,将分离所得的信号功率与输入信号功率作商,得到信噪比SNR。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610066930.6/1.html,转载请声明来源钻瓜专利网。