[发明专利]仿生眼定位追踪系统的工作方法有效
| 申请号: | 201610379179.5 | 申请日: | 2016-06-01 |
| 公开(公告)号: | CN106042005B | 公开(公告)日: | 2018-02-06 |
| 发明(设计)人: | 樊炳辉;李镇;刘勰;柏山清;尹逊敏 | 申请(专利权)人: | 山东科技大学 |
| 主分类号: | B25J19/04 | 分类号: | B25J19/04;B25J19/02;B25J13/08;B25J11/00 |
| 代理公司: | 济南金迪知识产权代理有限公司37219 | 代理人: | 段毅凡 |
| 地址: | 266590 山东省青岛市经*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 仿生 定位 追踪 系统 及其 工作 方法 | ||
技术领域
本发明涉及各种仿生眼对目标的定位追踪系统和工作方法,尤其涉及将仿生眼的双眼注视到说话人脸的仿生眼定位追踪系统和工作方法。
背景技术
目前,各种仿生机器人(如,仿人形、仿动物形等)对周围环境的感知系统,主要通过仿生眼和仿生耳来获取外界信息。
其中,在仿生眼的设计中,主要通过安装两个摄像头充当仿生眼来获取视频信息,对仿生眼整体结构建立数学模型,应用视觉处理的一些算法,实现对目标物体的三维信息计算和人脸识别等。与此相关的技术已经比较成熟,并且被广泛应用到工业、军事、医疗等诸多领域。
但是,现有的充当仿生眼的摄像头或者固定安装在某位置上,或者能通过人的操控进行方向调整,一般无法实现仿生眼与当前说话人的自动对视与跟踪,缺乏生动与友好交流效果。
在类似于仿生耳的声源定位技术中,已存在应用麦克风等声音信号采集装置来实现声源定位的应用,该技术为本领域的公知技术,如,下述文献:郑珍珍,冯华君,沈常宇等.基于坐标系变换的三维声源定位算法[J].浙江大学学报,2008,42(2):341-343(下简称文献1),其中就提到了一种基于声达时间差(TDOA)的声源定位技术,并给出了一种基于坐标系变换的三维声源定位算法。
但是,现有的声源定位方法只是依赖于麦克风等声音信号采集装置来收集信号,信息来源单一、稳定性低、误差大,在声源信号受到外界因素干扰时,这种声源定位方法无法实现对说话人的精准定位。
在展览或公开场合,在众人围观情形下,如何将仿生眼的两个摄像头能生动、准确地注视到说话人的脸上,并能自动跟随说话人的移动而转动双眼(两个摄像头),让对话人的脸能够实时处在摄像头采集到的图像中心,目前尚无此类技术与方法的研究。
发明内容
为了解决现有仿生眼无法实现自动注视与跟踪说话人脸的技术缺陷,本发明基于仿生眼和仿生耳的现有技术,提供一种仿生眼定位追踪系统,以实现将仿生眼的两个摄像头自动注视并跟踪到说话人脸。
本发明同时提供这种定位追踪系统的工作方法。
为达上述目的,本发明的仿生眼定位追踪系统主要由以下六部分组成:仿生眼云台模块、声音采集传感器阵列、摄像头模块、云台运动控制模块、控制器模块、上位机模块;其中:
所述的仿生眼云台模块包括:一个云台底座、一个搭载平台和左右两个子云台,其中,云台底座与搭载平台之间通过一个水平旋转关节相连,通过搭载平台在云台底座上的水平转动来模仿仿生机器人的颈部转动;在搭载平台上安装有左右两个子云台,左右两个子云台分别各有一个水平旋转架和一个俯仰旋转架,这样,每个子云台都具有水平旋转和俯仰旋转两个转动关节,两个摄像头分别安装在左右两个子云台中间的俯仰旋转架上,充当仿生眼的眼睛,通过左右两个子云台各自的水平旋转和俯仰旋转关节的转动,可以分别调整安装在左右两个子云台上的摄像头指向,来模仿眼睛的转动,这样的仿生眼云台模块总共有五个运动自由度,在搭载平台上的正中位置,绑定一个可随搭载平台水平转动的颈部坐标系。
所述的声音采集传感器阵列在本系统中充当仿生耳,将四个特性相同的麦克风,以仿生眼云台底座支点为中心,按正四面体的空间几何关系安装在云台底座中心周围,并将云台底座支点中心作为仿生眼云台基础坐标系的原点,这样,通过采集到的声音信号及声源定位算法(可参照背景技术中提到的文献1等提到的声源定位方法),得到说话人嘴部相对于基础坐标系的三维坐标值。
所述的摄像头模块由两个独立的摄像头组成,分别安装在左右两个子云台中间的俯仰旋转架上,在本系统中充当仿生眼的双眼,用来获取视频信息,并将视频数据传给上位机模块。
所述的云台运动控制模块包括:分别安装在左右两个子云台上的水平旋转驱动电机和俯仰旋转驱动电机、一个搭载平台的水平旋转驱动电机、数据传输模块。云台运动控制模块根据接收到的控制器模块输出的各个驱动电机转动信号来控制相应关节的驱动电机进行转动。
所述的控制器模块,一方面采集声音采集传感器阵列的输出信号,运行声源定位算法,获得说话人嘴部相对于云台基础坐标系的三维坐标值,并将该说话人嘴部的三维坐标传给上位机模块;另一方面接收上位机模块发出的控制指令和数据信息,来控制各个驱动电机转动相应角度,同时也向上位机模块返回系统的运动状态。
所述的上位机模块包括:仿生眼云台的眼睛水平转角α1和β1的求解运算程序、对搭载平台水平旋转转角θ的求解运算程序、仿生眼云台模块左右两个子云台关节空间的求解运算程序、视觉处理算法程序、与控制器的通信程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东科技大学,未经山东科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610379179.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种手持移动终端的电池固定结构
- 下一篇:一种新型电池筒





