[发明专利]长短帧联合的混合音频信号多基音估计方法无效
申请号: | 200910050350.8 | 申请日: | 2009-04-30 |
公开(公告)号: | CN101567188A | 公开(公告)日: | 2009-10-28 |
发明(设计)人: | 王冬梅;黄青华 | 申请(专利权)人: | 上海大学 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G05B13/00 |
代理公司: | 上海上大专利事务所(普通合伙) | 代理人: | 何文欣 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种长短帧联合的混合音频信号多基音估计方法。本方法首先将混合音频信号分成帧中心重合的长帧和短帧信号,并分别对其进行短时傅里叶变换;然后通过对长帧和短帧信号的频谱峰值进行基于谐波原理的迭代处理实现多基音初步估计。为提高基音估计的准确率,还进行了以下两步跟踪平滑:首先利用短时自相关方法计算得到的混合信号的主基音值进行跟踪平滑,然后使用长、短窗信号频谱中共同的第一峰值处的频率和非第一峰值整数倍共同的第二峰值处频率作为两个信号的基音值,继续平滑跟踪基音值。本方法的优点是长、短窗相结合,克服了短时傅立叶变换中时间分辨率和频率分辨率之间的矛盾,避免了由于主瓣太宽而使得某些谐波峰值因相互覆盖而丢失的缺点。同时两步跟踪平滑又使得某些帧中错误估计的基音值得到了校正。 | ||
搜索关键词: | 长短 联合 混合 音频 信号 基音 估计 方法 | ||
【主权项】:
1.长短帧联合的混合音频信号多基音估计方法,其特征在于基于谐波模型并结合长、短帧信号的频谱来对混合音频信号进行多基音估计,其步骤如下:(1)将混合音频信号分成帧中心相对应的长帧和短帧,分别对每一组长帧和短帧信号进行短时傅立叶变换,提取各自的频谱峰值并进行预处理,得到长窗信号的频谱峰值
以及短窗信号的频谱峰值
(2)利用长窗信号的频谱峰值
进行该帧混合信号的主基音初步估计:计算
所有峰值之间的频率间隔并作为潜在基音向量
再利用
每个元素与
中实际峰值频率的误差最小以及谐波数最多的联合约束条件来计算本帧初始主基音Pitchpromi;(3)利用Pitchpromi、
以及
判断本帧信号的个数状态,用状态向量
来表示;其判断过程是根据音频信号的谐波原理以及频谱峰值和频谱能量之间的关系,将混合信号分为四种情况,分别是:情况1,只有一个以Pitchpromi为基音的信号;情况2,只有一个以Pitchpromi的两倍或更高频率为基音值的信号;情况3,以高频基音信号为主能量信号,而以Pitchpromi为基音的信号是非主要能量信号;情况4,有两个信号且能量相当;(4)根据步骤(3)中个数状态向量
进行各种状态下的基音估计。在谐波原理的基础上,利用频谱峰值![]()
以及潜在基音向量
在频率上的整数倍关系,在频率偏差最小和谐波数最多的联合约束条件下,通过选取最优值进行多基音估计;(5)用每一帧的短时自相关峰值进行估计后的基音的平滑跟踪;(6)选择每一组对应长帧信号和短帧信号频谱峰值共同的第一峰值和第二峰值(非第一峰值整数倍)处的频谱对(5)中处理过的峰值进行第二次跟踪平滑;(7)利用连续基音值的相似性和连续谐波峰值相似性,将以上跟踪平滑过后的峰值进行聚类,使其归属到各自的信号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910050350.8/,转载请声明来源钻瓜专利网。