[发明专利]一种双讲检测方法、装置、计算机设备和存储介质有效
申请号: | 201911008388.9 | 申请日: | 2019-10-22 |
公开(公告)号: | CN110634496B | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 王亮亮 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 510530 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检测 方法 装置 计算机 设备 存储 介质 | ||
本发明实施例公开了一种双讲检测方法、装置、计算机设备和存储介质,该方法包括:当进行语音通信时,从麦克风接收音频信号,所述音频信号具有回声信号;确定所述回声信号的功率;根据所述回声信号的功率确定当前检测双讲状态的门限值;确定所述音频信号的功率;若所述音频信号的功率大于所述门限值,则确定所述语音通信存在所述双讲状态。结合回声信号的统计特性,动态适应对端用户发出声音的状态生成双讲检测的门限值,当环境中存在着不同水平的干扰或者噪声时,依然可自适应环境状态,保持门限值的精确性,从而保证使用该门限值进行双讲检测维持在较低的虚警概率。
技术领域
本发明实施例涉及音频处理的技术,尤其涉及一种双讲检测方法、装置、计算机设备和存储介质。
背景技术
在同时具有扬声器和麦克风的音频设备中,扬声器发出的音频信号经过空间的多次反射到达麦克风形成回声信号。
对于视频会议等语音通信,回声信号会严重地损伤通信质量以及降低语音识别率,特别是存在双讲(double-talk)的情况下,为了保证滤波器在双讲情况下的性能,回声消除一般都包含双讲检测的功能。
目前,基于相关或者能量检测的双讲检测都采用了静态的门限值作为判断的依据,当环境中存在着不同水平的干扰或者噪声时,静态的门限值会对导致双讲检测存在着较高的虚警概率。
发明内容
本发明实施例提供一种双讲检测方法、装置、计算机设备和存储介质,以解决使用静态的门限值进行双讲检测导致虚警概率较高的问题。
第一方面,本发明实施例提供了一种双讲检测方法,包括:
当进行语音通信时,从麦克风接收音频信号,所述音频信号具有回声信号;
确定所述回声信号的功率;
根据所述回声信号的功率确定当前检测双讲状态的门限值;
确定所述音频信号的功率;
若所述音频信号的功率大于所述门限值,则确定所述语音通信存在所述双讲状态。
可选地,所述确定所述回声信号的功率,包括:
确定参考音频信号;
确定所述参考音频信号的平均功率;
对所述参考音频信号的平均功率进行衰减增益,作为所述回声信号的功率。
可选地,所述确定参考音频信号,包括:
从扬声器采集待播放的音频信号,作为参考音频信号。
可选地,所述对所述参考音频信号的平均功率进行衰减增益,作为所述回声信号的功率,包括:
确定所述麦克风与所述扬声器之间的回声路径;
按照所述回声路径对所述参考音频信号的平均功率进行衰减增益,作为所述回声信号的功率。
可选地,所述根据所述平均功率确定当前检测双讲状态的门限值,包括:
确定检测双讲状态的虚警概率的目标值;
在所述目标值的限制下,基于所述回声信号的功率确定当前检测双讲状态的门限值。
可选地,所述在所述目标值的限制下,基于所述回声信号的功率确定当前检测双讲状态的门限值,包括:
将所述回声信号的功率分解为方差与平均值;
基于所述方差与所述平均值确定当前检测双讲状态的门限值,以使基于所述门限值检测双讲状态的虚警概率低于所述目标值。
可选地,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911008388.9/2.html,转载请声明来源钻瓜专利网。