[发明专利]语音分离方法、装置、计算机设备和存储介质有效
申请号: | 202011210358.9 | 申请日: | 2020-11-03 |
公开(公告)号: | CN112435684B | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 唐文军;贾晓谦;宋子岳;王冉 | 申请(专利权)人: | 中电金信软件有限公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L17/00;G10L25/18;G10L25/24;G10L15/16 |
代理公司: | 北京华进京联知识产权代理有限公司 11606 | 代理人: | 魏朋 |
地址: | 100192 北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 分离 方法 装置 计算机 设备 存储 介质 | ||
1.一种语音分离方法,其特征在于,所述方法包括:
获取待分离语音音频;
根据所述待分离语音音频,得到其对应的多个音频切片;
根据各个音频切片对应的频谱数据以及用于获取人耳听觉接受频率对应频谱的滤波器,得到对应人耳听觉接受频率的目标频谱,并根据所述目标频谱确定各个音频切片对应的第一声纹特征;
将多个音频切片对应的多个第一声纹特征输入到预先训练的声纹识别模型;所述声纹识别模型用于识别所述多个第一声纹特征之间的差别特征,并基于所述差别特征得到所述多个音频切片各自对应的第二声纹特征;
根据所述第二声纹特征对多个音频切片进行聚类,根据聚类结果对所述待分离语音音频中不同发音对象的语音音频进行语音分离。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标频谱确定各个音频切片对应的第一声纹特征,包括:
针对每个目标频谱,获取目标频谱中各个频率值对应的对数,并对所述对数进行离散余弦变换,得到所述目标频谱对应的倒谱系数,并确定为对应音频切片的第一声纹特征。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将具有发音对象标签的多个第一样本声纹特征输入至深度残差网络模型;所述深度残差网络模型用于识别所述多个第一样本声纹特征之间的差别特征,并基于所述差别特征输出发音对象预测值;
根据所述深度残差网络模型输出发音对象预测值和所述发音对象标签,确定所述深度残差网络模型的训练误差;
当所述训练误差大于预设误差阈值时,调整所述深度残差网络模型,返回将具有发音对象标签的多个第一样本声纹特征输入至深度残差网络模型的步骤,直到所述训练误差小于预设误差阈值,获取当前的深度残差网络模型为所述声纹识别模型。
4.根据权利要求1所述的方法,其特征在于,所述第二声纹特征为经过所述声纹识别模型中的卷积残差单元、恒等残差单元和池化残差单元对所述第一声纹特征进行处理后,输入至所述声纹识别模型中的全连接层的声纹特征向量,所述根据所述第二声纹特征对多个音频切片进行聚类,包括:
根据各音频切片对应的声纹特征向量,确定音频切片与聚类中心的相似度,根据所述相似度对多个音频切片进行多次聚类;
从多次聚类中确定聚类结果最佳的目标聚类;
从所述目标聚类对应的多个类簇中,筛选出类簇中音频切片数量大于或等于切片阈值的有效类簇,作为所述多个音频切片的聚类结果。
5.根据权利要求4所述的方法,其特征在于,所述根据各音频切片对应的声纹特征向量,确定音频切片与聚类中心的相似度,根据所述相似度对多个音频切片进行多次聚类,包括:
获取聚类中心,并根据各个音频切片对应的声纹特征向量,确定各个音频切片与各个聚类中心对应的余弦距离,由此确定各个音频切片与各个聚类中心的相似度;
根据所述相似度,将各个音频切片聚类至对应聚类中心的类簇中,直到聚类收敛;
判断当前类簇数量是否小于预设的发音对象数量阈值;
若是,增加聚类中心数量,并返回获取聚类中心,根据各个音频切片对应的声纹特征向量,确定各个音频切片与各个聚类中心的相似度的步骤;
若否,停止聚类。
6.根据权利要求4所述的方法,其特征在于,每个音频切片具有对应的时序编号,所述根据聚类结果对所述待分离语音音频中不同发音对象的语音音频进行语音分离,包括:
针对聚类结果中每个类簇,根据类簇中各个音频切片对应的时序编号,对多个连续音频切片进行拼接,得到拼接音频;
将所述拼接音频段确定为所述待分离语音音频中单个发音对象对应的语音分离结果。
7.根据权利要求6所述的方法,其特征在于,还包括:
获取所述拼接音频中首个语音切片对应的时序编号,作为首切片时序编号;
根据所述首切片时序编号,对多个拼接音频进行排序,得到语音分离对应的对话记录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电金信软件有限公司,未经中电金信软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011210358.9/1.html,转载请声明来源钻瓜专利网。