[发明专利]一种复调音乐多音高估计方法有效
申请号: | 201711358050.7 | 申请日: | 2017-05-02 |
公开(公告)号: | CN107945809B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 张维维;陈喆;殷福亮 | 申请(专利权)人: | 大连民族大学 |
主分类号: | G10L19/002 | 分类号: | G10L19/002;G10L19/02;G10L25/18;G10L25/69 |
代理公司: | 大连智高专利事务所(特殊普通合伙) 21235 | 代理人: | 刘斌 |
地址: | 116600 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 复调 音乐 多音 估计 方法 | ||
1.一种复调音乐多音高估计方法,其特征在于:包括如下步骤:
步骤1:对输入的音乐音频进行分帧;
步骤2:求每帧信号的伪双谱;
步骤3:根据公式(10),按照二维模板匹配互相关函数值从大到小排列,取出前10个频率作为候选音高;
步骤4:根据公式(11)计算各候选音高的加权谐波能量和,并选择具有最大加权谐波能量和的候选音高作为本次迭代输出音高,并保存音高值和相应的加权谐波能量;
步骤5:移除最显著音高的二维谐波成分;
步骤6:重复步骤3-5,直至本次输出音高的加权谐波能量和比前一音高的加权能量小20dB,输出所有迭代过程中估计的音高;
其具体方法如下:
设x(t)为复调音乐信号,则该信号的伪双谱定义为:
其中X(f1)和X(f2)为x(t)的一维傅里叶变换,(·)*代表共轭运算;f1和f2为二维频率域中的自变量,t和τ分别为时间域信号x(t)和x(τ)的自变量;
具有H个谐波分量的音符可表示为:
其中al为第l次谐波幅度,f0为基频,则根据公式(1)可得z(t)的伪双谱为
其中δ(·)为狄拉克函数,l和m为谐波次数,al和am分别为第l次和第m次谐波幅度;对于具有H个谐波分量的谐波信号,伪双谱变换生成H×H的二维模式;音符音高的确定(即二维模式匹配),可通过如下公式实现:
假设复调音乐由M个音符的混合信号组成,即可表示为:
其中Hm和f0,m分别为第m个音符的谐波数和音高,为第m个音符的第lm次谐波幅度;对于公式(5)所表示的混合信号的伪双谱为:
其中为第m个音符的伪双谱,为zm(t)和zn(t)的交叉项,且
其中(m,n)∈{1,2,...M},且m≠n;
假设Px为输入复调音乐伪双谱的离散化矩阵;每八度有Noct个对数分布离散频点,考虑每个音符的前Hr个谐波成分;令Q=(qi,j)是一个维度为Rq×Rq的稀疏矩阵,其中其中是向正无穷方向取整;当且仅当基频频点索引平移i和j个索引值后都对应谐波分量时,qi,j=1;按照下式计算二维模板与伪双谱的匹配互相关函数:
由于公式(1)满足共轭对称性,即
故公式(8)的互相关函数最大值对应的频率一定落在二维频率平面的第一象限对角线上,公式(8)可重新简化为:
根据公式(10)求出具有最大互相关函数输出的前10个频率值作为音高候选,然后按照下面公式(11)选择具有最大谐波加权能量和的频率作为最显著估计音高;
其中α=0.84,φk为音高fk的显著函数值,|X(hfk)|为fk的第h次谐波幅度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连民族大学,未经大连民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711358050.7/1.html,转载请声明来源钻瓜专利网。