[发明专利]语音数据的分离方法、装置、设备及存储介质在审

专利信息
申请号: 202110838468.8 申请日: 2021-07-23
公开(公告)号: CN113470688A 公开(公告)日: 2021-10-01
发明(设计)人: 张旭龙;王健宗 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G10L21/0272 分类号: G10L21/0272;G10L25/18;G10L25/30
代理公司: 深圳众鼎专利商标代理事务所(普通合伙) 44325 代理人: 陈美君
地址: 518000 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 数据 分离 方法 装置 设备 存储 介质
【权利要求书】:

1.一种语音数据的分离方法,其特征在于,包括:

获取待分离语音数据,并将所述待分离语音数据输入至人声分离模型;

对所述待分离语音数据进行多通道子频带处理,得到多个全频数据和多个子频带数据;其中,一个所述全频数据对应多个所述子频带数据;

对各所述全频数据以及与各所述全频数据对应的所有所述子频带数据进行人声频率特征提取,根据提取的所述人声频率特征进行人声频率点识别,得到与各所述全频数据一一对应的人声识别矩阵;

运用二值掩蔽方法,对所有所述人声识别矩阵进行掩码拼接处理,得到分离掩码结果;

根据所述分离掩码结果,对所述待分离语音数据进行人声分离,得到与所述待分离语音数据对应的人声音频数据。

2.如权利要求1所述的语音数据的分离方法,其特征在于,所述对所述待分离语音数据进行多通道子频带处理,得到多个全频数据和多个子频带数据,包括:

对所述待分离语音数据进行短时傅里叶变换处理,得到多个全频频谱图;所述人声分离模型包括一个全频特征提取模型和多个子频带特征提取模型,一个子频带特征提取模型对应一个子频带;

对各所述全频频谱图进行频带分解,得到与各所述全频频谱图对应的子频带频谱图;一个所述全频频谱图对应预设子频带个数的所述子频带频谱图,且每一个所述子频带频谱图对应一个子频带;

将各所述全频频谱图输入全频特征提取模型,通过所述全频特征提取模型对所述全频频谱图中的全频特征进行提取,得到与各所述全频频谱图一一对应的所述全频数据;

将各所述子频带频谱图输入与其子频带对应的子频带特征提取模型,通过各所述子频带特征提取模型提取各所述子频带频谱图中的与其子频带对应的音频特征,得到与各所述子频带频谱图一一对应的所述子频带数据。

3.如权利要求2所述的语音数据的分离方法,其特征在于,所述子频带包括低频频带和高频频带;

所述将各所述子频带频谱图输入与其子频带对应的子频带特征提取模型,通过各所述子频带特征提取模型提取各所述子频带频谱图中的与其子频带对应的音频特征,得到与各所述子频带频谱图一一对应的所述子频带数据,包括:

将与所述低频频带对应的所述子频带频谱图输入与所述低频频带对应的低频子频带特征提取模型,通过所述低频子频带特征提取模型对所述子频带频谱图进行低频频带的音频特征的提取,得到低频频带的所述子频带数据;所述低频子频带特征提取模型为基于MMDenseNet的深度学习模型;

将与所述高频频带对应的所述子频带频谱图输入与所述高频频带对应的高频子频带特征提取模型,通过所述高频子频带特征提取模型对所述子频带频谱图进行高频频带的音频特征的提取,得到高频频带的所述子频带数据;所述高频子频带特征提取模型为基于MMDenseNet的深度学习模型。

4.如权利要求1所述的语音数据的分离方法,其特征在于,所述对各所述全频数据以及与各所述全频数据对应的所有所述子频带数据进行人声频率特征提取,根据提取的所述人声频率特征进行人声频率点识别,得到与各所述全频数据一一对应的人声识别矩阵,包括:

对所述全频数据和与该全频数据对应的所有所述子频带数据进行多通道下采样,提取所述人声频率特征,得到与该全频数据对应的全频下采样特征向量,以及多个与所述子频带数据对应的子频带下采样特征向量;

根据所述全频下采样特征向量,对各所述子频带下采样特征向量进行联动的上采样,识别出与各所述子频带数据对应的子频带识别矩阵;

将所有与所述全频数据相对应的所述子频带识别矩阵进行串联,得到与该全频数据对应的所述人声识别矩阵。

5.如权利要求1所述的语音数据的分离方法,其特征在于,所述运用二值掩蔽方法,对所有所述人声识别矩阵进行掩码拼接处理,得到分离掩码结果,包括:

对所有所述人声识别矩阵按照时序方式拼接,对重叠的矩阵部分进行均值处理,得到待处理人声矩阵;

对所述待处理人声矩阵进行权重加成,得到待掩码矩阵;

运用二值掩蔽方法,对所述待掩码矩阵进行掩码处理,得到所述分离掩码结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110838468.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top