[发明专利]一种音频设备的声源定位的方法及音频设备在审

申请号：	201911046037.7	申请日：	2019-10-30
公开（公告）号：	CN110691196A	公开（公告）日：	2020-01-14
发明（设计）人：	杨培;陈强	申请（专利权）人：	歌尔股份有限公司
主分类号：	H04N5/232	分类号：	H04N5/232;G06K9/00
代理公司：	11442 北京博雅睿泉专利代理事务所(特殊普通合伙)	代理人：	马铁良
地址：	261031 山东省***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	声源场景图像指令摄像头音频设备麦克风阵列目标用户人脸识别摄像头采集声源定位识别率拾取采集
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种音频设备的声源定位的方法及音频设备。该音频设备包括麦克风阵列和摄像头，该方法包括：获取麦克风阵列拾取的声音信号指令，确定声音信号指令的声源方向；控制摄像头转向声源方向；采集声源方向的场景图像；对场景图像进行人脸识别以确定目标用户。本发明根据声音信号指令的声源方向，控制摄像头转向声源方向，通过摄像头采集场景图像，并通过对场景图像进行人脸识别确定发出声音信号指令的目标用户，能够进一步提高定位声源方向的准确性，以提高声音信号指令的识别率。

技术领域

本发明涉及音频信号识别技术领域技术，尤其涉及一种音频设备的声源定位的方法及音频设备。

背景技术

音频设备包括智能音箱或者带麦克风或麦克风阵列的摄像头。智能音箱是音箱升级的产物，是用户可以使用语音进行上网的一个工具，近年来，随着智能音箱的不断发展，智能音箱所囊括的内容资源越来越丰富。例如，用户可以使用智能音箱进行点播歌曲、听故事、语音交互等。

现有技术中，音频设备通过麦克风阵列拾取声音信号，实现语音交互。但是，在多人场景下，例如小型多人会议，多个用户同时说话，音频设备仅通过麦克风阵列不能准确定位拾取的声音信号的声源方向，不能确定需要进行语音交互的目标用户，影响用户体验。

发明内容

本发明的一个目的是提供一种基于音频设备的声源定位新技术方案。

根据本发明的第一方面，提供了一种音频设备的声源定位的方法，所述方法包括：

获取所述麦克风阵列拾取的声音信号，确定所述声音信号的声源方向；

控制所述摄像头转向所述声源方向；

采集所述声源方向的场景图像；

对所述场景图像进行人脸识别以确定目标用户。