[发明专利]一种通过多声源活动检测来改进双通道盲信号分离的方法有效

申请号：	201810265485.5	申请日：	2018-03-28
公开（公告）号：	CN108597531B	公开（公告）日：	2021-05-28
发明（设计）人：	王泽林;卢晶	申请（专利权）人：	南京大学
主分类号：	G10L21/0208	分类号：	G10L21/0208;G10L21/0272
代理公司：	南京知识律师事务所 32207	代理人：	李媛媛
地址：	210093 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种通过声源活动检测改进双通道信号分离方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种通过多声源活动检测来改进双通道盲信号分离的方法。该方法基于双通道TRINICON算法进行盲信号分离，将初步的处理前后的功率进行对比，若一个输出通道的信号功率明显低于另一个输出通道，则可判断这段信号中要抑制的目标声源处于活动状态，依此可对各段数据中各个目标声源是否处于活动状态进行判断。利用多声源活动判断的结果对TRINICON算法进行修正，使用目标声源活动的数据来更新滤波器系数，从而达到去除干扰、提高语音分离的性能的目的。本发明的方法能有效地改善在间断交错混合及稀疏混合的场景中TRINICON方法的分离性能。

技术领域

本发明涉及盲信号分离的技术领域，具体涉及一种基于双通道系统的通过多声源活动检测来改进盲信号分离性能的方法，在基于TRINICON(Triple-N ICA forconvolutive mixtures)结构的频域盲信号分离过程中加入多声源活动检测的算法。

背景技术

分离未知时间序列的卷积混合的问题在多个领域都有重要应用。一个重要的例子是所谓的鸡尾酒会问题，即将单个语音信号在混响的声学环境中从多个说话者的混合声中提取出来。由于混响的存在，这个分离问题的源信号在被传声器阵列采集前，先通过一个线性多输入多输出(MIMO)系统进行滤波。盲信号分离(BSS)是利用传声器阵列，不需要先验信息，基于不同声源信号相互统计独立的基本假设，即可将多个声源的信号进行分离的算法(S.Makino,H.Sawada,and T.W.Lee,Blind Speech Separation.Springer Netherlands,2007,pp.169-192.)。

基于独立分量分析(ICA)的盲信号分离是从干扰语音信号中提取所需语音信号的有效方法。但是频域ICA方法面临各频点排序模糊的问题，这需要基于频率间相关性信息的适当补充修复机制来修正。目前，该问题可以通过将ICA扩展到多变量情况，进行独立矢量分析(IVA)算法来解决，或者利用基于宽带标准的TRINICON方案来解决。TRINICON方法可以使用二阶统计量(SOS)在频域中有效地实现。

频域的离线TRINICON方法通常在声源进行连续混合时具有最佳性能。在实际应用中，语音信号有时会间断检错或者稀疏地进行混合，而离线的算法不考虑语音的活动状态，将每一段语音都平等地计入计算中，这样会导致性能恶化，尤其是当各个声源处于传声器阵列中线的一侧时，需要生成非因果滤波器。

发明内容

本发明的目的是为了提高频域TRINICON算法在间断交错混合及稀疏混合的情景下的性能，提供一种通过多声源活动检测来改进双通道盲信号分离的方法。

本发明为解决上述技术问题采取的技术方案是：

一种通过多声源活动检测来改进双通道盲信号分离的方法，包括如下步骤：

(1)对频域TRINICON算法中的滤波器矩阵参数进行初始化；

(2)传声器接收到的声源信号输入双通道系统，将每个通道的输入信号分块，再用短时傅立叶变换将每一块的输入信号变换到频域；

(3)由Y^(k)＝X^(k)W^(k)计算每一块的输出信号，其中Y^(k)、X^(k)和W^(k)分别为频域的输出信号、频域的输入信号及频域的滤波器系数矩阵，上标(k)为短时离散傅立叶变换中频点的序号；然后计算各输出信号的功率谱密度矩阵Φ_yy；

(4)按照自然梯度下降法更新滤波器系数，使用逆短时傅立叶变换将滤波器系数矩阵变换回时域并将时域的滤波器系数大于滤波器长度减1的部分置零；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京大学，未经南京大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】