[发明专利]远场语音交互中的自动增益控制方法、装置及可读存储介质有效

申请号：	201910358510.9	申请日：	2019-04-29
公开（公告）号：	CN110111805B	公开（公告）日：	2021-10-29
发明（设计）人：	陈日林;陈孝良;冯大航	申请（专利权）人：	北京声智科技有限公司
主分类号：	G10L21/0208	分类号：	G10L21/0208;G10L21/0224;G10L25/03;G10L25/60;G10L25/78
代理公司：	中科专利商标代理有限责任公司 11021	代理人：	任岩
地址：	100086 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音交互中的自动增益控制方法装置可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开提供了一种远场语音交互中的自动增益控制方法、装置及可读存储介质，包括：区分远场语音信号中的目标信号和非目标信号；对所述目标信号和所述非目标信号分别计算增益，并得到当前帧远场语音信号相对于上一帧的增益改变量；当所述增益改变量大于预定阈值时，更新增益表；将当前帧的所述远场语音信号按照当前所述增益表处理，获取放大后的语音信号。本公开在对远场语音信号进行增益时，能够有效提高目标信号，减少非目标信号的增益。

技术领域

本公开涉及语音识别领域，尤其涉及一种远场语音交互中的自动增益控制方法、装置及可读存储介质。

背景技术

随着人工智能技术的发展，语音是识别技术也随之不断进步，语音识别技术已经运用于多个领域，例如语音助手、智能电视、智能音箱等。但是，语音识别技术的基础是如何获取优质的目标信号，即指令发出者的语音信号，优质的目标信号有利于提高对语音信号的语义识别的准确的。语音信号根据声源与麦克风阵列距离的远近，可以分为近场语音(near-fieldaudio)信号和远场语音(far-field audio)信号，而对于远场语音信号的识别存在诸多难点，例如，获取远场语音信号后如何进行增益。

AGC(Automatic Gain Control自动增益控制)用于根据语音信号的不同对语音信号的不同部分进行增益。但是已有的AGC方法大多是针对近场语音信号的增益，通过使用一个固定的增益因子来进行增益。因此，需要一种新的AGC方法来对远场语音信号进行增益，能够有效增益目标信号，减少对非目标信号的增益。

发明内容

(一)要解决的技术问题

本公开提供了一种远场语音交互中的自动增益控制方法，以至少部分解决以上所提出的技术问题。

(二)技术方案

根据本公开的一个方面，提供了一种远场语音交互中的自动增益控制方法，包括：

区分远场语音信号中的目标信号和非目标信号；

对所述目标信号和所述非目标信号分别计算增益，并得到当前帧的远场语音信号相对于上一帧的增益改变量；

当所述增益改变量大于预定阈值时，更新增益表；

识别将当前帧的所述远场语音信号，按照当前所述增益表进行处理，获取放大后的语音信号。

进一步的，区分远场语音信号中的目标信号和非目标信号包括：

对判断不同时间段的远场语音信号进行为人声信号的概率，根据概率判断结果区分目标信号和非目标信号，其中所述目标信号为人声信号，所述非目标信号为环境噪声信号；和/或

由每一路麦克风信号能量相对于整体信号能量所占的比例，获取每一帧该路麦克风采集的信号中目标信号与非目标信号的判断结果，其中所述目标信号为目标语音信号，所述非目标信号为干扰语音信号和/或干扰非语音信号；和/或