[发明专利]一种视线估计方法有效
申请号: | 201210118799.5 | 申请日: | 2012-04-20 |
公开(公告)号: | CN102662476A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 车明;张磊;岑坤昉 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G06K9/00 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 温国林 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视线 估计 方法 | ||
技术领域
本发明涉及人机交互领域,特别涉及一种视线估计方法。
背景技术
人机交互是随着科技的不断发展而发展的,自从计算机出现以来人机交互技术经历了巨大的变化,人机交互的发展历史,是从人适应计算机到计算机不断适应人的发展史。早期的手工作业阶段,计算机是一个十分庞大笨拙的二进制计算机,使用者必须利用计算机代码语言和手工操作的方法来使用计算机;在作业控制语言及交互命令语言阶段,计算机的主要使用者(程序员)可以通过记忆许多命令和敲击键盘,采用批处理作业语言或交互命令语言的方式来调试程序、了解计算机执行情况;以上两个阶段都是应用键盘和字符显示器进行人机交互,而到了图形用户界面(GUI)阶段,鼠标和基于图形菜单的出现,可使用户可以直接操纵计算机而无须掌握复杂的计算机语言,不懂计算机的普通用户也可以熟练地使用,大大的拓宽了用户群,使信息产业得到空前的发展,计算机适应人的序幕正式拉开;新的技术不断出现:搜索引擎、网络加速、多媒体动画、聊天工具等都使人机交互上升到一个更高的境界。
多通道、多媒体的智能人机交互阶段是真正人机交互的开始。当前计算机的两个重要的发展趋势是计算机系统的拟人化和计算机的微型化、随身化和嵌入化,例如:虚拟现实、手持电脑和智能手机等。单通道的交互方式已向多通道交互方式转变,人机交互已经更为人性化,操作亦向自然、高效的方向发展。结合视线跟踪、语音识别和手势输入等技术的多媒体和多通道的人机交互界面是未来的研究方向。
由于人的视线具有直接性、自然性和双向性等其他信息所无法具备的特点,所以人们对视线估计的研究有着深厚的兴趣。在面部识别的基础上,我们可以进一步利用视线估计技术,计算出用户在屏幕上所关注的区域。视线估计技术的应用领域十分广阔,例如:智能家电、广告研究、智能计算机、虚拟游戏、汽车驾驶、助残和军事等领域,具有十分广阔的应用前景。在网页及广告设计中,可利用视线估计技术来获取用户的主要关注区域,进行设计评估。在智能计算机中,可使用视线估计技术代替传统的鼠标进行控制和输入。并可逐步取代一般人机交互输入系统,作为特定目标系统的输入子系统,为目标系统的事实控制动作提供判断依据,服务于需要双手进行操作的专业人士,该系统可以广泛应用于医学、交通、军事及娱乐等各个方面,提供全新的信息输入手段,全面提升社会科技水平。
发明人在实现本发明的过程中,发现现有技术中存在以下的缺点和不足:
目前大多数视线估计方法大多采用瞳孔角膜反射向量法,因为它具有良好的用户体验和较高的估计精度,但由于需要额外辅助光源,同时用户在使用过程中必须保持头部静止,而且随着头部的运动,该方法的估计精度会急剧下降。其精度一般在10~20mm,但其运用的一般是双目摄像头或者多个辅助光源,且对头部运动的适应性较差。近几年国内也有很多关于视线估计方法的研究技术,虽然视线估计的精度比较好,但也需要额外辅助光源。
发明内容
本发明提供了一种视线估计方法,本发明减少了额外辅助设备,提高了对头部运动的适应性并且具有较好的精度,详见下文描述:
一种视线估计方法,所述方法包括以下步骤:
(1)用户按照预设条件注视屏幕上的若干指定点,获取注视点估计值的横纵坐标数据,横纵坐标数据用于计算校准误差S′h;
(2)从所述摄像头拍摄的图像中获取双眼内眼角在图像上的坐标,判断双眼内眼角中心是否在图像中央,如果是,执行步骤(4);如果否,执行步骤(3);
(3)通过双眼的内眼角在图像上的坐标获取双眼内眼角中心点的坐标与图像中央点的差量FM,将双眼内眼角、双眼瞳孔中心和脸边界的横坐标与纵坐标整体进行坐标变换以完成用户头部偏移的校正,执行步骤(4);
(4)判断用户脸平面与屏幕平面之间是否有旋转角度β,如果是,执行步骤(5);如果否,执行步骤(6);
(5)双眼内眼角与对应脸边界的距离不同,对用户头部旋转,根据所述旋转角度β对所述双眼内眼角、所述双眼瞳孔中心的坐标进行转换,将用户脸平面校正为正脸;
(6)将用户脸平面、屏幕距离与双眼内眼角点三者之间的关系表示成三次多项式函数,通过待定系数法确定多项式函数的系数;
(7)获取3D模型,根据所述3D模型获取注视点的纵坐标和横坐标,通过所述三次多项式函数确定注视点S′f,其中,所述注视点的纵坐标具体为眼球光轴与屏幕交点的纵坐标;所述注视点的横坐标具体为左右眼的光轴与屏幕交点的横坐标的平均值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210118799.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:偏振板的制造方法
- 下一篇:通道损耗均匀且通带响应平坦的蚀刻衍射光栅器件