[发明专利]一种加速语音控制设备声源定位的方法及装置在审
申请号: | 202010129828.2 | 申请日: | 2020-02-28 |
公开(公告)号: | CN111398904A | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 李阳 | 申请(专利权)人: | 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司 |
主分类号: | G01S5/24 | 分类号: | G01S5/24;G10L15/22 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 张楠楠 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 加速 语音 控制 设备 声源 定位 方法 装置 | ||
本发明公开了一种加速语音控制设备声源定位的方法及装置,所述方法包括:基于用户确定的语音控制设备,确定初始估计角度范围,其中,所述初始估计角度范围用于表征声源所在方位的初始角度范围;当所述用户唤醒所述语音控制设备时,基于预设角度范围进行计算,以得到声源对应的角度;将所述声源对应的角度确定为经验角度;基于所述经验角度,对所述初始估计角度范围进行调整,得到目标估计角度范围,以根据所述目标估计角度范围完成声源定位。通过本发明的技术方案,不仅大大降低计算量,而且降低定位的延时。
技术领域
本发明涉及声音处理技术领域,特别涉及一种加速语音控制设备声源定位的方法及装置。
背景技术
智能家居场景中,为了定向拾音,提高远场语音识别率,首先要进行声源定位。
目前,在声源定位时的估计角度范围通常为360度或180度,而没有考虑家居场景的实际情况,比如智能音箱放在墙角,声源定位时的角度范围只覆盖90度,而估计角度范围为360度或180度,远远大于实际情况中的角度范围,这就造成在根据估计角度范围确定声源位置时,不仅计算量大而且定位的延时较长,影响用户体验;
发明内容
本发明提供一种加速语音控制设备声源定位的方法及装置,所述技术方案如下:
根据本发明实施例的第一方面,提供了一种加速语音控制设备声源定位的方法,包括:
基于用户确定的语音控制设备,确定初始估计角度范围,其中,所述初始估计角度范围用于表征声源所在方位的初始角度范围;
当所述用户唤醒所述语音控制设备时,基于预设角度范围进行计算,以得到声源对应的角度;
将所述声源对应的角度确定为经验角度;
基于所述经验角度,对所述初始估计角度范围进行调整,得到目标估计角度范围,以根据所述目标估计角度范围完成声源定位。
在一个实施例中,所述当所述用户唤醒所述语音控制设备时,基于预设角度范围进行计算,以得到声源对应的角度,包括:
获取所述用户对所述语音控制设备的唤醒指令;
基于所述唤醒指令,计算所述预设角度范围内每个角度对应的可控响应功率谱函数值,其中,所述每个角度之间的间隔为预设度数;
确定数值最大的可控响应功率谱函数值对应的角度为所述声源对应的角度。
在一个实施例中,所述基于所述经验角度,对所述初始估计角度范围进行调整,得到目标估计角度范围,以根据所述目标估计角度范围完成声源定位,包括:
基于所述经验角度,对所述初始估计角度进行调整,以得到调整后的角度范围;
验证所述调整后的角度范围是否满足预设标准,当满足所述预设标准时,确定所述调整后的角度范围为所述目标估计角度范围,以根据所述目标估计角度范围完成声源定位;
当不满足所述预设标准时,确定所述初始估计角度范围为所述目标估计角度范围,以根据所述目标估计角度范围完成声源定位。
在一个实施例中,在所述基于所述经验角度,对所述初始估计角度范围进行调整,得到目标估计角度范围,以根据所述目标估计角度范围完成声源定位之前,包括:
确定所述经验角度的个数;
判断所述个数是否大于预设阈值,当所述个数大于预设阈值时,开始基于所述经验角度,对所述初始估计角度范围进行调整,得到目标估计角度范围,以根据所述目标估计角度范围完成声源定位。
在一个实施例中,所述以根据所述目标估计角度范围完成声源定位,包括:
计算所述目标估计角度范围内每个角度对应的可控响应功率谱函数值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010129828.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:显示面板和显示装置
- 下一篇:一种MCS存储系统的协议配置方法、装置及设备