[发明专利]一种基于MMSE的歌曲去伴奏方法和装置有效

申请号：	201410331430.1	申请日：	2014-07-11
公开（公告）号：	CN104134444B	公开（公告）日：	2017-03-15
发明（设计）人：	王子亮	申请（专利权）人：	福建星网视易信息系统有限公司
主分类号：	G10L21/0272	分类号：	G10L21/0272;G10L21/0216;G10L21/0316;G10L25/45
代理公司：	福州市景弘专利代理事务所(普通合伙)35219	代理人：	林祥翔,吕元辉
地址：	350000 福建省福州市仓山区金山***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 mmse 歌曲伴奏方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及音频信号处理领域

背景技术

歌声分离系统在某些领域有广泛的应用，例如歌词的自动识别和校正，就需要以先期的人声分离作为基础来进行。歌词自动识别通常要求输入处理系统的是单独的人声，有伴奏干扰的情况下很难完成，但因为大多数歌曲都同时包含歌声与乐器伴奏，直接进行是不实际的。

在从不同声源分离声音问题上，这样的任务对于人来说是容易的，但对于机器而言却很困难。语音分离已经得到广泛的研究，但由于音乐是一种极其复杂的信号，包含歌声以及不同乐器的多路信号混合在一起，并且乐器声音与歌声还是相关的，采用语音信号盲分离技术很难分离出纯净的歌声。

最小均方误差(Minimum Mean-Square Error，MMSE)估计是一种语音增强算法，其能够有效地抑制背景噪声，从而提高输入信号的信噪比(Signal-to-Noise Ratio，SNR)。对于最小均方误差估计，在Y.Ephraim和D.Malah的文献《Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator，IEEE Trans.Acoustic，Speech，and Signal Processing》(Vol.ASSP-32，pp.1109-1121，1984)中进行了详细的描述。

发明内容

为此，需要提供一种有效地从一歌曲音频信号中分离或提取出人声的方法。

为此，发明人提供了一种基于MMSE的歌曲去伴奏的方法，包括步骤：

输入歌曲音频信号和与其对应的伴奏音频信号，所述伴奏音频信号与歌曲音频信号存在时间同步关系；

分别将歌曲音频信号和伴奏音频信号由时域信号变换为频域信号；

对伴奏音频信号的幅度谱进行增强处理；

根据增强处理后的伴奏音频信号的幅度谱，对歌曲音频信号的频谱进行最小均方误差估计获得谱增益系数；

根据所述谱增益系数以及歌曲音频信号的频谱得到去伴奏音频信号的频谱；

将去伴奏音频信号的频谱逆变换为时域信号。

在步骤“分别将歌曲音频信号和伴奏音频信号由时域信号变换为频域信号”之前还包括步骤：对歌曲音频信号和伴奏音频信号进行归一化处理，再将歌曲音频信号和伴奏音频信号分别划分为若干帧，每帧包括预设数量的声音采样点，并且相邻帧之间有预设数量的重合采样点。

步骤“将经归一化处理的歌曲音频信号和伴奏音频信号分别划分为若干帧”后还包括步骤：

对每帧进行加汉宁窗滤波处理。