[发明专利]远场语音交互中的自动增益控制方法、装置及可读存储介质有效
| 申请号: | 201910358510.9 | 申请日: | 2019-04-29 |
| 公开(公告)号: | CN110111805B | 公开(公告)日: | 2021-10-29 |
| 发明(设计)人: | 陈日林;陈孝良;冯大航 | 申请(专利权)人: | 北京声智科技有限公司 |
| 主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0224;G10L25/03;G10L25/60;G10L25/78 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 任岩 |
| 地址: | 100086 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 交互 中的 自动增益控制 方法 装置 可读 存储 介质 | ||
本公开提供了一种远场语音交互中的自动增益控制方法、装置及可读存储介质,包括:区分远场语音信号中的目标信号和非目标信号;对所述目标信号和所述非目标信号分别计算增益,并得到当前帧远场语音信号相对于上一帧的增益改变量;当所述增益改变量大于预定阈值时,更新增益表;将当前帧的所述远场语音信号按照当前所述增益表处理,获取放大后的语音信号。本公开在对远场语音信号进行增益时,能够有效提高目标信号,减少非目标信号的增益。
技术领域
本公开涉及语音识别领域,尤其涉及一种远场语音交互中的自动增益控制方法、装置及可读存储介质。
背景技术
随着人工智能技术的发展,语音是识别技术也随之不断进步,语音识别技术已经运用于多个领域,例如语音助手、智能电视、智能音箱等。但是,语音识别技术的基础是如何获取优质的目标信号,即指令发出者的语音信号,优质的目标信号有利于提高对语音信号的语义识别的准确的。语音信号根据声源与麦克风阵列距离的远近,可以分为近场语音(near-fieldaudio)信号和远场语音(far-field audio)信号,而对于远场语音信号的识别存在诸多难点,例如,获取远场语音信号后如何进行增益。
AGC(Automatic Gain Control自动增益控制)用于根据语音信号的不同对语音信号的不同部分进行增益。但是已有的AGC方法大多是针对近场语音信号的增益,通过使用一个固定的增益因子来进行增益。因此,需要一种新的AGC方法来对远场语音信号进行增益,能够有效增益目标信号,减少对非目标信号的增益。
发明内容
(一)要解决的技术问题
本公开提供了一种远场语音交互中的自动增益控制方法,以至少部分解决以上所提出的技术问题。
(二)技术方案
根据本公开的一个方面,提供了一种远场语音交互中的自动增益控制方法,包括:
区分远场语音信号中的目标信号和非目标信号;
对所述目标信号和所述非目标信号分别计算增益,并得到当前帧的远场语音信号相对于上一帧的增益改变量;
当所述增益改变量大于预定阈值时,更新增益表;
识别将当前帧的所述远场语音信号,按照当前所述增益表进行处理,获取放大后的语音信号。
进一步的,区分远场语音信号中的目标信号和非目标信号包括:
对判断不同时间段的远场语音信号进行为人声信号的概率,根据概率判断结果区分目标信号和非目标信号,其中所述目标信号为人声信号,所述非目标信号为环境噪声信号;和/或
由每一路麦克风信号能量相对于整体信号能量所占的比例,获取每一帧该路麦克风采集的信号中目标信号与非目标信号的判断结果,其中所述目标信号为目标语音信号,所述非目标信号为干扰语音信号和/或干扰非语音信号;和/或
获取通过声学回声消除计算过程中的双讲判断结果判断目标信号与非目标信号,其中所述目标信号为近端语音信号,所述非目标信号为远端语音信号。
进一步的,所述判断不同时间段的远场语音信号进行为人声信号的概率,根据概率判断结果区分目标信号和非目标信号包括:
计算得到当前时间段的远场语音信号的概率密度p,并与预设的人声阈值比较,当所述概率密度p大于所述人声阈值,则判定为人声信号,否则判定为环境噪声信号。
进一步的,所述由每一路麦克风信号能量相对于整体信号能量所占的比例,获取每一帧该路麦克风采集的信号中目标信号与非目标信号的判断结果包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910358510.9/2.html,转载请声明来源钻瓜专利网。





