[发明专利]一种双讲状态检测方法、装置、存储介质及终端设备有效
申请号: | 202010998626.1 | 申请日: | 2020-09-21 |
公开(公告)号: | CN112165558B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 陈英博 | 申请(专利权)人: | 普联国际有限公司 |
主分类号: | H04M9/08 | 分类号: | H04M9/08;G10L21/0224;G10L21/0232;G10L25/18;G10L25/60 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 麦小婵;郝传鑫 |
地址: | 中国香港九龙尖沙咀科*** | 国省代码: | 香港;81 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 状态 检测 方法 装置 存储 介质 终端设备 | ||
1.一种双讲状态检测方法,其特征在于,包括:
分别获取第一端麦克风频域信号和第二端扬声器频域信号;
对所述第二端扬声器频域信号进行语音活性检测,获得所述第二端扬声器频域信号的检测结果;
若所述第二端扬声器频域信号的检测结果为第二端存在语音信号,则分别计算所述第一端麦克风频域信号的第一频谱能量和所述第二端扬声器频域信号的第二频谱能量;
根据所述第一频谱能量和所述第二频谱能量的差异判断双讲状态;
所述根据所述第一频谱能量和所述第二频谱能量的差异判断双讲状态具体包括:
对比第一频点集合和第二频点集合,得到P个在所述第一频点集合中而没有在所述第二频点集合中的频点作为差异频点;其中,所述第一频点集合由从所述第一端麦克风频域信号中提取出的能量值最大的前K个频点组成,所述第二频点集合由从所述第二端扬声器频域信号中提取出的能量值最大的前K个频点组成,K≥P>0;
计算P个差异频点的频点能量之和,得到第三频谱能量;
根据公式计算得到综合差异值;其中,z为综合差异值,A1、A2为加权因子,S1为第三频谱能量,Smax为第一频谱能量;
当所述综合差异值大于预设阈值时,第一端和第二端均存在语音信号;
当所述综合差异值小于或等于预设阈值时,第一端没有语音信号而第二端存在语音信号。
2.如权利要求1所述的双讲状态检测方法,其特征在于,所述分别获取第一端麦克风频域信号和第二端扬声器频域信号,具体包括:
分别获取第一端麦克风原始时域信号和第二端扬声器时域信号;
以第二端扬声器时域信号为参考,将所述第一端麦克风原始时域信号进行时延估计对齐,得到第一端麦克风时域信号;
将所述第一端麦克风时域信号和第二端扬声器时域信号分别进行傅里叶变换,得到所述第一端麦克风频域信号和所述第二端扬声器频域信号。
3.如权利要求1所述的双讲状态检测方法,其特征在于,计算所述第一端麦克风频域信号的第一频谱能量具体包括:
从所述第一端麦克风频域信号中提取M个第一待筛选频点;
分别计算M个所述第一待筛选频点的加权能量,得到M个第一待筛选频点能量;
从M个所述第一待筛选频点能量中选取出能量值最大的前K个频点能量,前K个频点能量对应的频点的集合为第一频点集合;其中,M>K>0;
对所述前K个频点能量进行累加,得到所述第一频谱能量。
4.如权利要求3所述的双讲状态检测方法,其特征在于,计算所述第二端扬声器频域信号的第二频谱能量具体包括:
从所述第二端扬声器频域信号中提取M个第二待筛选频点;
分别计算M个所述第二待筛选频点的加权能量,得到M个第二待筛选频点能量;
从M个所述第二待筛选频点能量中选取出能量值最大的前K个频点能量,前K个频点能量对应的频点的集合为第二频点集合;其中,M>K>0;
对所述前K个频点能量进行累加,得到所述第二频谱能量。
5.如权利要求1至4任一项所述的双讲状态检测方法,其特征在于,所述方法还包括:
若所述第二端扬声器频域信号的检测结果为第二端不存在语音信号,则返回所述分别获取第一端麦克风频域信号和第二端扬声器频域信号的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普联国际有限公司,未经普联国际有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010998626.1/1.html,转载请声明来源钻瓜专利网。