[发明专利]基于口-双耳房间脉冲响应的鲁棒语音增强方法及系统有效

申请号：	202010499174.2	申请日：	2020-06-04
公开（公告）号：	CN113763983B	公开（公告）日：	2022-03-22
发明（设计）人：	柯雨璇;侯畅;郑成诗;李晓东	申请（专利权）人：	中国科学院声学研究所
主分类号：	G10L21/0224	分类号：	G10L21/0224;G10L21/0232
代理公司：	北京方安思达知识产权代理有限公司 11472	代理人：	陈琳琳;杨青
地址：	100190 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于耳房脉冲响应语音增强方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于口‑双耳房间脉冲响应的鲁棒语音增强方法及系统，所述方法包括：获取原始的带噪信号；从预先建立好的多通道口‑双耳房间脉冲响应数据库中提取若干组多通道口‑双耳房间脉冲响应；将多通道口‑双耳房间脉冲响应经傅里叶变换转换为频域传递函数，由频域传递函数充当导向矢量，组成导向矢量矩阵；对导向矢量矩阵进行特征值分解，在最小化输出信号能量的同时对主要的特征向量进行约束，通过求解凸优化问题计算得到波束形成权向量；利用波束形成权向量对原始的带噪信号进行加权求和，输出增强后的语音信号。本发明的方法可以有效抑制远场同向干扰声源，并且相对于传统近场波束形成器具有更高的鲁棒性。

技术领域

本发明涉语音增强领域。尤其涉及基于口-双耳房间脉冲响应的鲁棒语音增强方法及系统。

背景技术

如今耳机设备受到了人们越来越多的青睐和关注，尤其是真无线耳机，近两年来不论在学术领域还是在商业领域，都是专家学者们着力研究、开发以及量产的产品之一。随着蓝牙、音频编码、集成电路以及人工智能等技术的快速发展，人们对耳机设备的依赖程度越来越高，对耳机通信质量的要求也越来越高。但是，在耳机通信的实际应用中，复杂的噪声环境会导致通信质量严重降低。因此针对耳机设备的语音增强技术尤为重要。

语音增强技术的主要目的是从噪声环境中提取佩戴者目标语音并降低噪声干扰，从而提高语音的清晰度和可懂度。其中传声器阵列语音增强算法由于引入了空域信息，相对于单通道语音增强算法，能够更好的抑制方向性干扰噪声。波束形成是传声器阵列语音增强算法的重要分支，它能够形成空间指向性，达到增强期望信号、抑制干扰和噪声的目的。其中，自适应波束形成是现在广泛使用的一类传声器阵列语音增强方法。其最大的特点和优势在于它可以依据接收数据和不同的最优化准则，动态的更新权矢量，使得到的波束主瓣指向期望信号，同时抑制其他方向的干扰和噪声。常见的自适应波束形成方法包括最小方差无失真响应(Minimum Variance Distortionless Response,MVDR)波束形成器、线性约束最小方差(Linearly Constrained Minimum Variance,LCMV)法，以及广义旁瓣消除法(Generalized Sidelobe Canceller,GSC)等。

传统自适应波束形成方法大多都是针对远场声学模型，但是双耳佩戴式传声器阵列与用户构成典型的双耳近场声学模型，此时应用远场声学模型会带来较大的模型失配，造成算法性能显著下降。另外，相较于远场自适应波束形成方法，传统近场自适应波束形成器对目标声源的方位和距离更加敏感。因此，建立符合双耳近场声学模型的口-双耳房间脉冲响应(Oral-Binaural Room Impulse Response，OBRIR)数据库是研究鲁棒双耳自适应波束形成器的重要前提。为了解决传统近场自适应波束形成器鲁棒性较差的问题，较典型的方法是基于特征值分解的LCMV(SVD-LCMV) 方法，对近场目标位置局部区域的导向矢量进行特征值分解，并对其主特征向量施加无失真输出约束条件，从而提高算法的鲁棒性。然而该方法仅适用于自由场声学模型，并未考虑双耳近场模型中的人头以及躯干等散射体对声学模型的影响。

发明内容

本发明的目的在于克服现有技术缺陷，提出了一种基于口-双耳房间脉冲响应的鲁棒语音增强方法，本发明还公开了一种基于口-双耳房间脉冲响应的鲁棒语音增强系统。

为了实现上述目的，本发明提出了一种基于口-双耳房间脉冲响应的鲁棒语音增强方法，所述方法包括：

获取原始的带噪信号；

从预先建立好的多通道口-双耳房间脉冲响应数据库中提取若干组多通道口-双耳房间脉冲响应；将多通道口-双耳房间脉冲响应经傅里叶变换转换为频域传递函数，由频域传递函数充当导向矢量，组成导向矢量矩阵；对导向矢量矩阵进行特征值分解，在最小化输出信号能量的同时对主要的特征向量进行约束，通过求解凸优化问题计算得到波束形成权向量；

利用波束形成权向量对原始的带噪信号进行加权求和，输出增强后的语音信号。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所，未经中国科学院声学研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010499174.2/2.html，转载请声明来源钻瓜专利网。

上一篇：医疗系统用空气成像机构及非接触式医疗服务装置
下一篇：格兰地新或其可药用盐的新应用

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于口-双耳房间脉冲响应的鲁棒语音增强方法及系统有效

专利文献下载