[发明专利]一种语音分离方法及装置有效

申请号：	201810820474.9	申请日：	2018-07-24
公开（公告）号：	CN108962276B	公开（公告）日：	2020-11-17
发明（设计）人：	代金良	申请（专利权）人：	杭州听测科技有限公司
主分类号：	G10L21/0216	分类号：	G10L21/0216;G10L21/0272;G10L25/30
代理公司：	合肥市浩智运专利代理事务所(普通合伙) 34124	代理人：	丁瑞瑞
地址：	310000 浙江省杭州市钱塘新***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音分离方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音分离方法，其特征在于，所述方法包括：

获取各个信号通道的待分离语音数据，其中，所述待分离语音数据含有至少两个人同时说话时产生的语音数据；

针对每一预设的采样时刻，利用盲源分离算法对所述待分离语音数据进行分离处理，得到P个分离信号；

针对每一个分离信号，计算当前分离信号与所述P个分离信号中除所述当前分离信号之外的其他分离信号之间的交叉残留系数；并判断所述交叉残留系数是否小于第一预设阈值；

若否，利用回声消除算法对所有交叉残留系数不小于第一预设阈值的分离信号，进行回声消除处理，并将处理后的分离信号与所有交叉残留系数小于第一预设阈值的分离信号的集合作为目标分离信号；

若是，将所述分离信号作为目标分离信号；

所述计算当前分离信号与所述P个分离信号中除所述当前分离信号之外的其他分离信号之间的交叉残留系数，包括：

利用公式，计算当前分离信号与所述P个分离信号中除所述当前分离信号之外的其他分离信号之间的交叉残留系数，其中，

为第i个通道的当前分离信号与所述P个分离信号中除所述当前分离信号之外的其他分离信号之间的交叉残留系数；i为当前分离信号的通道的编号；j为所述P个分离信号中除所述当前分离信号之外的其他分离信号的通道的编号；a_i,k为第i个通道的分离信号与第k个分离信号之间的混合系数；a_j,k为第j个通道的分离信号与第k个分离信号之间的混合系数；y_k为第k个通道的声源信号；∑为求和函数。

2.根据权利要求1所述的一种语音分离方法，其特征在于，所述盲源分离算法包括：非线性主分量分析、独立分量分析、神经网络算法、最大熵算法、最小互信息算法、最大似然算法中的一种或多个的组合。

3.根据权利要求1所述的一种语音分离方法，其特征在于，所述利用盲源分离算法对所述待分离语音数据进行分离处理，包括：

针对各个所述待分离语音数据，利用NPCA准则建立针对所述待分离语音数据的代价函数其中，

J(W)为第t时刻的分离矩阵的代价；E{.}为期望运算函数；x(t)为各个麦克风对应的信号通道所观测到的观测信号；W为分离矩阵；(.)^T为转置运算；为非线性函数；t为当前时刻；

对所述代价函数进行最小化处理，得到分离矩阵的迭代估计为：

W(t+1)＝W(t)+θ*z(t)[x^T(t)-z^T(t)W(t)]，其中，

W(t+1)为第t+1时刻的分离矩阵；W(t)为第t时刻的分离矩阵；θ为迭代步长，且θ(t)为第t时刻的迭代步长，θ(t-1)为第t-1时刻的迭代步长，ρ为常数，为梯度函数，J(t)为第t时刻的代价；z(t)为非线性函数，且

利用公式，W(t+1)＝W(t)+θ*z(t)[x^T(t)-z^T(t)W(t)]，迭代计算下一时刻的分离矩阵，直至所述分离矩阵收敛，得到各个待分离语音数据的目标分离矩阵；

利用公式，y(t)＝Wx(t)，得到所述待分离语音数据的分离后的信号，其中，y(t)为当前观测信号的分离后的信号。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杭州听测科技有限公司，未经杭州听测科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810820474.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种语音增强方法，装置及耳机
下一篇：语音信号分离方法、装置、计算机设备以及存储介质

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种语音分离方法及装置有效

专利文献下载