[发明专利]远场语音交互中的自动增益控制方法、装置及可读存储介质有效
| 申请号: | 201910358510.9 | 申请日: | 2019-04-29 |
| 公开(公告)号: | CN110111805B | 公开(公告)日: | 2021-10-29 |
| 发明(设计)人: | 陈日林;陈孝良;冯大航 | 申请(专利权)人: | 北京声智科技有限公司 |
| 主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0224;G10L25/03;G10L25/60;G10L25/78 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 任岩 |
| 地址: | 100086 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 交互 中的 自动增益控制 方法 装置 可读 存储 介质 | ||
1.一种远场语音交互中的自动增益控制方法,包括:
区分远场语音信号中的目标信号和非目标信号;
对所述目标信号和所述非目标信号分别计算增益,并得到当前帧的远场语音信号相对于上一帧的增益改变量;
当所述增益改变量大于预定阈值时,更新增益表;
将当前帧的所述远场语音信号,按照当前所述增益表进行处理,获取放大后的语音信号;
其中,区分远场语音信号中的目标信号和非目标信号包括:
判断不同时间段的远场语音信号进行为人声信号的概率,根据概率判断结果区分目标信号和非目标信号,其中包括:计算得到当前时间段的远场语音信号的概率密度p,并与预设的人声阈值比较,当所述概率密度p大于所述人声阈值,则判定为人声信号,否则判定为环境噪声信号,所述目标信号为人声信号,所述非目标信号为环境噪声信号;和/或
由每一路麦克风信号能量相对于整体信号能量所占的比例,获取每一帧该路麦克风采集的信号中目标信号与非目标信号的判断结果,其中包括:获取麦克风信号处理广义旁瓣对消器中的每一帧信号的状态值active_on,若所述状态值active_on=1,则判定为目标语音信号;若所述状态值active_on=0,则判定为干扰语音信号和/或干扰非语音信号,所述目标信号为目标语音信号,所述非目标信号为干扰语音信号和/或干扰非语音信号;和/或
通过声学回声消除计算过程中的双讲判断结果判断目标信号与非目标信号,其中所述目标信号为近端语音信号,所述非目标信号为远端语音信号。
2.根据权利要求1所述的自动增益控制方法,其中,所述通过声学回声消除计算过程中的双讲判断结果判断目标信号与非目标信号包括:
获取麦克风采集的远场语音信号声学回声消除计算过程中每一帧信号的双讲判断结果double_talk,若所述double_talk=1,则判定为近端语音信号;若所述double_talk=0,则判定为远端语音信号。
3.根据权利要求1所述的自动增益控制方法,其中,对所述目标信号和所述非目标信号分别进行增益处理,并得到每一帧远场语音信号相对于上一帧的增益改变量包括:
根据所述目标信号和所述非目标信号的判断结果,计算当前帧的增益,若为目标信号,则用于计算增益表的增益表计算参量gain取最大增益值,若为非目标信号则所述增益表计算参量gain取最小增益值,并获取当前帧的增益与前一帧增益之间的差值作为增益改变量。
4.根据权利要求3所述的自动增益控制方法,包括:
获取当前帧的增益gain_cur(t)=α*gain_cur(t-1)+(1-α)*gain,
Δgain=gain_cur(t)-gain_cur(t-1),
其中,t为帧数,α为平滑系数,gain_cur(t-1)为前一帧的增益,Δgain为增益改变量,gain为用于计算增益表的增益表计算参量,若当前远场语音信号为目标语音,gain=gain_max;若当前远场语音信号为非目标语音,gain=gain_min;其中gain_max为最大增益值,gain_min为最小增益值。
5.根据权利要求3或4所述的自动增益控制方法,其中,所述最大增益值大于1,所述最小增益值为1或小于1。
6.根据权利要求1所述的自动增益控制方法,其中,当所述增益改变量大于预定阈值时,更新增益表包括:
设定一预定阈值,若当前帧的增益与前一帧增益的差值大于该预定阈值时,所述增益表根据能量进行计算更新,再将前一帧增益值设置为当前帧增益。
7.根据权利要求6所述的自动增益控制方法,其中,包括:
当增益改变量Δgain>a时,更新增益表,更新增益表后,令gain_cur(t-1)=gain_cur(t),其中,a为预定阈值,gain_cur(t)为当前帧增益,gain_cur(t-1)为前一帧的增益。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910358510.9/1.html,转载请声明来源钻瓜专利网。





