[发明专利]一种基于相关熵的注视点估计方法有效
申请号: | 201710240474.7 | 申请日: | 2017-04-13 |
公开(公告)号: | CN107103293B | 公开(公告)日: | 2019-01-29 |
发明(设计)人: | 张雪涛;李中常;王飞;陈霸东;王颖;姜沛林;郑南宁 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 何会侠 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 相关 注视 点估计 方法 | ||
本发明公开了一种基于相关熵的注视点估计方法,包含步骤如下:1、人脸图像采集;2、人眼图像亚像素提取;3、人眼图像特征降维;4、注视点位置估计;本发明方法能在不同的环境条件下对注视点进行精确的估计。
技术领域
本发明涉及人机交互的注视点估计领域,具体涉及基于相关熵的注视点估计方法。
背景技术
近年来,眼睛注视跟踪技术复杂性和应用性已经引起了商业部门的极大兴趣。各种各样的学科中使用眼睛注视追踪技术,包括认知科学、心理学(特别是心理语言学、视觉世界的范式),人机交互(HCI)、市场研究和医学研究(神经诊断)。具体应用包括跟踪眼动在语言阅读,音乐阅读,人类活动识别,广告设计,和运动设计。因此,对注视追踪的研究一直吸引着研究者的兴趣。
注视点估计精度通常会受到提取的人眼图像的影响,对人眼图像的超像素级别的提取有利于提高注视估计精度。对于传统的对人眼提取算法,这些算法主要是利用提取特征点的方法对人眼内外眼角点进行判断,然后利用人眼图像高和宽的比例对人眼进行分割。但是根据这些算法提取出来的人眼图像跟真正的人眼图像有很大的偏差,而且在实际中实验对象头部姿态会有一些偏差,这样更不利于对人眼图像的精确提取。
对注视点的估计主要依据注视点空间与人眼特征空间的相似性,根据空间结构的权重共享关系,从而对注视点进行估计。但是在对人眼特征空间和注视点空间进行建模中,由于结构的差异性,需要对人眼特征空间进行降维处理,从而实现二者结构的相似性或者一致性。而传统的算法例如PCA,LDA等算法,这些算法仅仅利用人眼特征的局部信息或者全局信息,而忽略注视空间的信息,这样对人眼特征进行降维后的空间不能保证与注视空间结构的相似性。这样会导致在对注视点过程中因为空间结构的差异性导致注视估计误差的产生。所以基于注视空间的人眼特征降维处理有着重要的作用。
在一般情况下,对实验对象进行注视点估计,需要一个标定的过程,而传统的方法需要测试者进行较长时间的标定过程,需要很多标定点才能达到高的精度。注视点估计在不同环境下的适用性方面也面临着挑战,例如摄像机分辨率低,或者有噪声干扰的环境下,这对注视点估计有着很大的影响。因此在不同环境下的适应性对注视点估计应用有着很大的影响。
发明内容
本发明的目的是克服上述现有的技术的缺点,提供了一种基于相关熵的注视点估计方法,该方法能在不同的环境条件下对注视点进行精确的估计。
为了达到上述目的,本发明采用如下技术方案:
一种基于相关熵的注视点估计方法,该方法只需要单摄像头以及在屏幕上均匀标定点,具体包括如下步骤:
步骤1:人脸图像提取:在对注视点估计过程中,采用adboost人脸检测算法对人脸图像进行提取;
步骤2:人眼图像亚像素提取:在经过步骤(1)对人脸图像进行提取后,采用亚像素级的方法对人眼图像进行精准提取,具体方法为:主要是在不同的头部姿态条件下,寻找最优的人眼区域图像;首先初始化人眼区域的初始顶点坐标e0(x,y),通过对齐操作后的位置信息为e(x,y),二者之间的变换函数如下:
在公式中transform(x,y)是对齐变换函数,s为图像缩放比例,θ是旋转角度,tx,ty是在x、y方向上的偏移像素位移;
假设E={vec(e1)|...|vec(en)}是标准的裁剪的人眼图像集,作为训练样本,通过人眼区域图像对齐操作使下面目标函数实现最小化实现对人眼图像提取:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710240474.7/2.html,转载请声明来源钻瓜专利网。