[发明专利]一种针对位置靠近声源的语音信号分离方法有效
申请号: | 202111125927.4 | 申请日: | 2021-09-26 |
公开(公告)号: | CN113823316B | 公开(公告)日: | 2023-09-12 |
发明(设计)人: | 廖乐乐;卢晶;陈锴 | 申请(专利权)人: | 南京大学 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/028 |
代理公司: | 江苏法德东恒律师事务所 32305 | 代理人: | 李媛媛 |
地址: | 210046 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 位置 靠近 声源 语音 信号 分离 方法 | ||
本发明公开了一种针对位置靠近声源的语音信号分离方法。该方法的步骤包括:步骤1,获取待处理的混合语音时频域信号;步骤2,初始化各频带的分离矩阵;步骤3,对所有频带的分离矩阵进行联合优化;步骤4,对所述分离矩阵进行幅度规整;步骤5,估计出分离后的时频域语音信号;步骤6,由分离后的时频域语音信号恢复出时域语音信号。本发明的方法可以在声源位置靠近的不利条件下,帮助分离算法获得更好的语音信号分离效果。
技术领域
本发明涉及语音处理的技术领域,尤其是涉及一种语音信号分离技术。
背景技术
语音分离技术可以从多个声源的混合信号中分离出原始的声源信号,是语音信号处理领域的一项重要任务,在智能家居系统、视频会议系统以及语音识别系统等多种应用场景下都发挥了重要作用。
在多通道的语音信号处理方案中,独立矢量分析(IVA)通过联合概率分布模型建立源信号各个频率成分的关联,进而构建整体代价函数。Auxiliary function based IVA(AuxIVA)和Independent low-rank matrix analysis(ILRMA)被认为是目前最先进的卷积混合音频信号的分离方法。AuxIVA算法利用了majorization-minimization(MM)的优化技巧,推导出了iterative projection(IP)迭代规则,能够对分离矩阵进行快速又稳定的优化。AuxIVA的优化方式也可以与其他更加灵活的信号模型相结合。ILRMA则是融合了AuxIVA的优化策略和MNMF的信号模型,在利用MNMF强大表示能力的同时也保证了每一次迭代后的代价都是非增的。
理想情况下IVA的分离效果与声源位置无关,然而实际情况下,由于有噪声的存在,当声源位置靠近的时候,算法的分离效果显著下降,这在很大程度上限制了分离算法在实际中的应用。如何提高位置靠近声源的分离效果是一个值得关注的技术问题。
发明内容
为了解决上述技术问题,本发明提出了一种针对位置靠近声源的语音信号分离方法,该方法能显著提高语音信号的分离效果。
本发明采用的技术方案为:
一种针对位置靠近声源的语音信号分离方法,包括如下步骤:
步骤1,获取待处理的混合语音时频域信号;
步骤2,对混合语音时频域信号初始化各频带的分离矩阵;
步骤3,对所有频带的分离矩阵进行联合优化以解决排序不确定性;
步骤4,对优化后的分离矩阵进行幅度规整;
步骤5,根据步骤4处理后的分离矩阵估计出时频域语音信号;
步骤6,由步骤5估计的时频域语音信号恢复出时域语音信号。
进一步地,所述步骤1的具体步骤为:利用信号采集系统获取待处理混合语音的时域信号,对该时域信号做短时傅里叶变换,得到待处理混合语音的时频域信号。
进一步地,所述步骤2中,初始化各频带的分离矩阵采用的是单位矩阵,矩阵的对角元素是1,其余元素是0。
进一步地,所述步骤3中,对所有频带的分离矩阵进行联合优化的具体步骤为:(1)选取源信号分布模型,获得代价函数;(2)对所述代价函数选取优化方法,得到分离矩阵的更新规则;(3)使用所述更新规则对分离矩阵进行迭代直到收敛,得到各频带优化后的分离矩阵。
进一步地,所述步骤4中,根据最小失真准则对分离矩阵进行幅度规整。
进一步地,所述步骤5的具体步骤为:将步骤4得到的分离矩阵与待处理的混合语音时频域信号相乘,估计出分离后的时频域语音信号。
进一步地,所述步骤6的具体步骤为:对步骤5估计的时频域语音信号做短时傅里叶逆变换,得到分离后的时域语音信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111125927.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防坠家用电梯
- 下一篇:一种基于铌酸锂薄膜的脊形波导端面耦合器