[发明专利]一种针对位置靠近声源的语音信号分离方法有效
申请号: | 202111125927.4 | 申请日: | 2021-09-26 |
公开(公告)号: | CN113823316B | 公开(公告)日: | 2023-09-12 |
发明(设计)人: | 廖乐乐;卢晶;陈锴 | 申请(专利权)人: | 南京大学 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/028 |
代理公司: | 江苏法德东恒律师事务所 32305 | 代理人: | 李媛媛 |
地址: | 210046 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 位置 靠近 声源 语音 信号 分离 方法 | ||
1.一种针对位置靠近声源的语音信号分离方法,其特征在于,该方法包括如下步骤:
步骤1,获取待处理的混合语音时频域信号;
步骤2,对混合语音时频域信号初始化各频带的分离矩阵;
步骤3,对所有频带的分离矩阵进行联合优化以解决排序不确定性;具体步骤为:
步骤31,选取源信号分布模型,获得代价函数;
当选取拉普拉斯分布作为源信号分布模型,所述代价函数为:
其中,表示取样本平均,G(·)是由源信号模型决定的得分函数;n是源信号指标且n=1,2,…,N,N是源信号的总个数;k是频率指标且k=1,2,…,K,K是总的频带个数;表示第k个频带内的第n个估计信号,detWk是第k个频带内的分离矩阵的行列式;
当选取多通道非负矩阵分解作为源信号模型,所述代价函数为:
其中,t是时间帧指标,tkl,n和vlt,n分别是不同声源的基和激活参数,l是基的指标,n是源信号指标且n=1,2,…,N,N是源信号的总个数;k是频率指标且k=1,2,…,K,K是总的频带个数;表示第k个频带内的第n个估计信号的第t帧,detWk是第k个频带内的分离矩阵的行列式;
步骤32,对所述代价函数采用majorization-minimization的优化方法,得到分离矩阵的更新规则;
步骤33,使用所述更新规则对分离矩阵进行迭代直到收敛,得到各频带优化后的分离矩阵;
步骤4,对优化后的分离矩阵进行幅度规整;
步骤5,根据步骤4处理后的分离矩阵估计出时频域语音信号;
步骤6,由步骤5估计的时频域语音信号恢复出时域语音信号。
2.根据权利要求1所述的一种针对位置靠近声源的语音信号分离方法,其特征在于,所述步骤1的具体步骤为:利用信号采集系统获取待处理混合语音的时域信号,对该时域信号做短时傅里叶变换,得到待处理混合语音的时频域信号。
3.根据权利要求1所述的一种针对位置靠近声源的语音信号分离方法,其特征在于,所述步骤2中,初始化各频带的分离矩阵采用的是单位矩阵,矩阵的对角元素是1,其余元素是0。
4.根据权利要求1所述的一种针对位置靠近声源的语音信号分离方法,其特征在于,步骤32中,当选取拉普拉斯分布作为源信号分布模型,得到分离矩阵的更新规则为:
其中表示分离矩阵Wk的第n行,上标H表示共轭转置,xk表示第k个频带内的混合信号向量,M表示总的传声器个数,G'(·)表示G(·)的一阶导数,G(rn)=rn,G'(rn)=1;en表示单位向量,第n个元素是1,其余元素是0;
当选取多通道非负矩阵分解作为源信号模型,得到分离矩阵的更新规则为:
其中tkl,n和vlt,n的更新规则分别为:
其中,表示取样本平均,en表示单位向量,第n个元素是1,其余元素是0,l’是基的新指标;表示分离矩阵Wk的第n行,上标H表示共轭转置。
5.根据权利要求1所述的一种针对位置靠近声源的语音信号分离方法,其特征在于,所述步骤4中,根据最小失真准则对分离矩阵进行幅度规整,具体步骤为:
Wk←(Wk(Wk)H)-1/2Wk
其中,k是频率指标,k=1,2,…,K,K是总的频带个数;Wk表示第k个频带的分离矩阵,上标H表示共轭转置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111125927.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防坠家用电梯
- 下一篇:一种基于铌酸锂薄膜的脊形波导端面耦合器