[发明专利]通话状态检测方法、装置、计算机系统和介质在审
申请号: | 201910491201.9 | 申请日: | 2019-06-06 |
公开(公告)号: | CN112133324A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 童颖 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L21/0208;G10L15/06;G10L25/18;G10L25/27;G10L25/30;G10L25/48;G10L25/51 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 李春伟 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通话 状态 检测 方法 装置 计算机系统 介质 | ||
本公开提供了一种通话状态检测方法、装置、计算机系统和介质,该通话状态检测方法包括:获得语音信号;获取所述语音信号的语音特征,所述语音特征包括基于听觉特性的特征,并且与消除所述语音信号中回声的算法解耦;将所述语音特征输入通话模式识别模型,确定所述语音信号的通话状态为单端通话状态或双端通话状态。
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种通话状态检测方法、装置、计算机系统和介质。
背景技术
在语音通话过程中,语音通话产品(例如手机)接收到来自网络侧的远端信号并经过扬声器播放后,在声学通路产生回声信号,回声信号和近端语音被麦克风采集后,会被传送至另一通话端。为了消除回声信号,现有技术采用声学回声消除技术,该技术的原理为:利用自适应滤波器模拟回声路径,得到估计的回声信号,从麦克风采集的近端信号中减去估计的回声信号,实现了回声消除。
在回声消除技术中,需要检测出麦克风采集的近端信号中是否存存在近端语音,如果存在近端语音,则为双端通话状态,会影响自适应滤波器系数的更新过程,导致滤波器系数发散。对于通话状态检测技术,现有技术中主要基于能量的检测方法以及基于双滤波的检测方法。
在实现本公开构思的过程中,发明人发现现有技术中至少存在如下问题:现有技术进行通话状态检测时,不易实现在线检测和在使用较小计算量的前提下保证检测结果的准确度。
发明内容
有鉴于此,本公开提供了一种能在线检测和在使用较小计算量的前提下保证检测结果的准确度的通话状态检测方法、装置、计算机系统和介质。
本公开的一个方面提供了一种通话状态检测方法,可以包括如下操作,首先,获得语音信号,然后,获取所述语音信号的语音特征,所述语音特征包括基于听觉特性的特征,并且与消除所述语音信号中回声的算法解耦,接着,将所述语音特征输入通话模式识别模型,确定所述语音信号的通话状态为单端通话状态或双端通话状态。
根据本公开的实施例,语音特征为基于听觉特性的特征,且与消除所述语音信号中回声的算法解耦,因此,无需借助其他算法如回声抵消算法(Acoustic EchoCancellation,简称AEC)来获得特征量的估计,可以在线获得输入参数,且检测结果准确。
根据本公开的实施例,所述语音特征可以包括以下至少一种:梅尔频率倒谱系数特征、幅度调制频谱特征、相对频谱转换的感知线性预测系数特征和滤波器组功率谱特征。这样便于基于这些语音特征确定当前语音信号中是否包括两个相关度较高的语音信息,基于信息的相关度确定语音信号的通话状态。
根据本公开的实施例,所述语音特征还可以进一步包括辅助特征,其中,所述辅助特征与所述消除所述语音信号中回声的算法耦合。这样有助于提升通话状态的判断结果的准确度。
根据本公开的实施例,所述通话模式识别模型的拓扑结构为具有第一指定个数层的神经网络,其中,所述通话模式识别模型的输入为语音信号的当前帧,以及以下至少一种:当前帧之前第二指定个数帧、当前帧之后第三指定个数帧。加入指定个数上下文的帧的输入信息来做增强,使神经网络能够利用前后帧之间的相关信息做通话状态做更好的区分。此外,因为神经网络具有很好的非线性的建模能力,所以这里采用基于听觉特性的特征可以利用神经网络的这种建模能力学习到更有区分性的特征。
根据本公开的实施例,所述通话模式识别模型的输出包括二值掩蔽,所述二值掩蔽包括多个频率点的通话状态,其中,所述多个频率点为一帧语音信号的频谱图中包括的多个频率点。这种方式可以将输出判断划分为更细的粒度,然后通过判断在一帧里面所有频率点的值,来判断该帧是属于单端通话状态还是属于双端通话状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910491201.9/2.html,转载请声明来源钻瓜专利网。