[发明专利]一种基于声纹到达相位的可旋转摄像装置及其控制方法在审
申请号: | 202110039123.6 | 申请日: | 2021-01-13 |
公开(公告)号: | CN112367473A | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 焦显伟;孟夏冰 | 申请(专利权)人: | 北京电信易通信息技术股份有限公司 |
主分类号: | H04N5/232 | 分类号: | H04N5/232 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 刘凤玲 |
地址: | 100097 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 声纹 到达 相位 旋转 摄像 装置 及其 控制 方法 | ||
本发明公开了一种基于声纹到达相位的可旋转摄像装置及其控制方法。所述可旋转摄像装置包括:摄像头、旋转模块、控制模块、模数转换模块和麦克风阵列;摄像头设置在旋转模块上,摄像头、旋转模块和模数转换模块均与控制模块连接;麦克风阵列与模数转换模块连接;麦克风阵列包括
技术领域
本发明涉及声音识别领域,特别是涉及一种基于声纹到达相位的可旋转摄像装置及其控制方法。
背景技术
近年来,随着计算机、网络、图像处理以及传输技术的飞速发展,摄像头被广泛的应用到视频直播、远程会议等实时语音视频通信中去。在此类实时通信系统中,主讲人的信息,包括面部表情、肢体动作等,会比其他细节更被远程观众关注。
目前市场上现有的可以追踪人脸的摄像头,大多是以图像处理原理进行追踪。但是该方法不仅存在图像处理计算量大的问题,并且当多人使用时,摄像头容易分辨不清,无法达到追踪主讲人的效果。
发明内容
基于此,有必要提供一种基于声纹到达相位的可旋转摄像装置及其控制方法,以在减小计算量的同时,达到追踪主讲人的效果。
为实现上述目的,本发明提供了如下方案:
一种基于声纹到达相位的可旋转摄像装置,包括:摄像头、旋转模块、控制模块、模数转换模块和麦克风阵列;
所述摄像头设置在所述旋转模块上,所述摄像头、所述旋转模块和所述模数转换模块均与所述控制模块连接;所述麦克风阵列与所述模数转换模块连接;
所述麦克风阵列包括
可选的,所述控制模块包括:
声音信号获取单元,用于获取
判断单元,用于判断所述数字信号是否为人声信号;
滤波单元,用于若所述数字信号为人声信号,则采用数字带通滤波器对所述人声信号进行滤波,得到预设频率下的人声信号;
初始相位确定单元,用于由所述声音信号的到达时间确定各组所述预设频率下的人声信号的初始相位;
双曲线建立单元,用于对于任意两组所述预设频率下的人声信号,由两组所述预设频率下的人声信号的初始相位计算相位偏差,由所述相位偏差和载波频率计算所述相位偏差对应的距离差,并以所述距离差对应的两个所述麦克风的位置为焦点,以所述距离差为差值建立双曲线;
声源位置确定单元,用于将不同组合下得到的多个所述双曲线的交点确定为声源位置;
旋转控制单元,用于根据所述声源位置控制所述旋转模块旋转,以实现所述摄像头对声源的追踪。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京电信易通信息技术股份有限公司,未经北京电信易通信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110039123.6/2.html,转载请声明来源钻瓜专利网。