[发明专利]一种多人语音的分离方法和装置有效

申请号：	201810904488.9	申请日：	2018-08-09
公开（公告）号：	CN110164469B	公开（公告）日：	2023-03-10
发明（设计）人：	陈联武;于蒙;钱彦旻;苏丹;俞栋	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G10L21/0272	分类号：	G10L21/0272;G10L25/27
代理公司：	深圳市深佳知识产权代理事务所(普通合伙) 44285	代理人：	王仲凯
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明实施例公开了一种多人语音的分离方法和装置，用于实现在多人语音场景下的语音与语音之间的分离。本发明实施例提供一种多人语音的分离方法，包括：从待分离的混合语音信号中提取出混合语音特征，所述混合语音信号中混合有N种人声，所述N为大于或等于2的正整数；使用生成对抗网络模型对所述混合语音特征进行掩蔽系数提取，得到N种人声对应的掩蔽矩阵；使用所述生成对抗网络模型对所述N种人声所对应的掩蔽矩阵和所述混合语音信号进行语音分离，输出与所述N种人声对应的N种分离语音信号。
搜索关键词：	一种人语分离方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种多人语音的分离方法，其特征在于，包括：从待分离的混合语音信号中提取出混合语音特征，所述混合语音信号中混合有N种人声，所述N为大于或等于2的正整数；使用生成对抗网络模型对所述混合语音特征进行掩蔽系数提取，得到N种人声对应的掩蔽矩阵；使用所述生成对抗网络模型对所述N种人声所对应的掩蔽矩阵和所述混合语音信号进行语音分离，输出与所述N种人声对应的N种分离语音信号。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于腾讯科技（深圳）有限公司，未经腾讯科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810904488.9/，转载请声明来源钻瓜专利网。

上一篇：一种基于双麦克风的语音增强方法及装置
下一篇：人声分离方法、装置、用户终端及存储介质

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种多人语音的分离方法和装置有效

专利文献下载