[发明专利]长短帧联合的混合音频信号多基音估计方法无效
申请号: | 200910050350.8 | 申请日: | 2009-04-30 |
公开(公告)号: | CN101567188A | 公开(公告)日: | 2009-10-28 |
发明(设计)人: | 王冬梅;黄青华 | 申请(专利权)人: | 上海大学 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G05B13/00 |
代理公司: | 上海上大专利事务所(普通合伙) | 代理人: | 何文欣 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 长短 联合 混合 音频 信号 基音 估计 方法 | ||
1.长短帧联合的混合音频信号多基音估计方法,其特征在于基于谐波模型并结合长、短帧信号的频谱来对混合音频信号进行多基音估计,其步骤如下:
(1)将混合音频信号分成帧中心相对应的长帧和短帧,分别对每一组长帧和短帧信号进行短时傅立叶变换,提取各自的频谱峰值并进行预处理,得到长窗信号的频谱峰值以及短窗信号的频谱峰值
(2)利用长窗信号的频谱峰值进行该帧混合信号的主基音初步估计:计算所有峰值之间的频率间隔并作为潜在基音向量再利用每个元素与中实际峰值频率的误差最小以及谐波数最多的联合约束条件来计算本帧初始主基音pitchpromi;
(3)利用pitchpromi、以及判断本帧信号的个数状态,用状态向量来表示;其判断过程是根据音频信号的谐波原理以及频谱峰值和频谱能量之间的关系,将混合信号分为四种情况,分别是:情况1,只有一个以Pitchpromi为基音的信号;情况2,只有一个以pitchpromi的两倍或更高频率为基音值的信号;情况3,以高频基音信号为主能量信号,而以Pitchpromi为基音的信号是非主要能量信号;情况4,有两个信号且能量相当;
(4)根据步骤(3)中个数状态向量进行各种状态下的基音估计,在谐波原理的基础上,利用频谱峰值以及潜在基音向量在频率上的整数倍关系,在频率偏差最小和谐波数最多的联合约束条件下,通过选取最优值进行多基音估计;
(5)用每一帧的短时自相关峰值进行估计后的基音的平滑跟踪;
(6)选择每一组对应长帧信号和短帧信号频谱峰值共同的第一峰值和第二峰值处的频谱对步骤(5)中处理后的基音进行第二次跟踪平滑,其中第二峰值非第一峰值整数倍;
(7)利用连续基音值的相似性和连续谐波峰值相似性,将以上跟踪平滑过后的峰值进行聚类,使其归属到各自的信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910050350.8/1.html,转载请声明来源钻瓜专利网。