[发明专利]一种结合全局颜色与局部结构特征的人眼凝视点提取方法有效
申请号: | 201810400117.7 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108647605B | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 崔子冠;吴依珂;陈赐宗;谭欣;刘峰 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 210003 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 全局 颜色 局部 结构 特征 凝视 提取 方法 | ||
本发明公开了一种结合全局颜色与局部结构特征的人眼凝视点提取方法,读入一幅待检测图像,在RGB颜色空间对图像中的像素颜色做均匀量化以提取全局颜色特征,基于颜色对比度在整个图像范围内计算全局显著度图,然后提取图像的亮度信息,在亮度通道内计算每一像素的局部回归核以提取局部结构特征,基于结构对比度在局部范围内计算局部显著度图,最后融合全局颜色显著度图和局部结构显著度图得到初步的人眼关注度图,再结合中心先验对初步的人眼关注度图进行调整,经高斯滤波后得到最终的人眼凝视点位置。本发明通过结合由全局颜色特征和局部结构特征得到的图像显著度图,更好地表达了图像中的显著信息,提高了人眼凝视点提取的准确性和鲁棒性。
技术领域
本发明涉及图像处理中的显著度区域自动分析技术领域,具体涉及一种结合全局颜色与局部结构特征的人眼凝视点提取方法。
背景技术
图像中人眼凝视点的自动分析与提取技术是近年来图像处理与分析领域的研究热点,图像中人眼凝视点定义为图像中最吸引人眼关注的位置和区域,在机器人导航、快速场景分析、图像质量评价、视频优化编码等方面都有重要的应用。
目前图像人眼凝视点的自动分析与提取方法大致分为两大类:一类是基于任务或高层语义特征驱动的自顶向下(Top-down)的方法,另一类是基于低层或中层图像特征的自底向上(Bottom-up)的方法。自顶向下的方法通过模拟人脑对图像认知的过程进行人眼凝视点的预测,通常计算复杂度较高且速度较慢。而自底向上的方法更多利用了图像低层特征之间的对比度关系,计算复杂度较小且速度较快,是目前人眼凝视点预测的主流技术。
到目前为止,最有代表性的自底向上的人眼凝视点提取方法是LaurentItti等人在1998年提出的基于中心周围差分的方法(Laurent Itti,Christof Koch,and ErnstNiebur,“A model of saliency-based visual attention for rapid scene analysis,”IEEE Transactions on Pattern Analysis and Machine Intelligence,vol.20,no.11,pp.1254-1259,Nov.1998.),该方法通过提取多尺度的亮度、颜色和方向特征进行对比度计算,最后通过跨尺度融合得到人眼关注点,计算复杂度较高且不够准确。还有一类基于频域分析的方法,如XiaodiHou等人在2012年提出的基于图像签名的显著度检测方法(XiaodiHou,Jonathan Harel and Christof Koch,“Imagesignature:highlightingsparse salient regions,”IEEE Transactions on Pattern Analysis and MachineIntelligence,vol.34,no.1,pp.194-201,Jan.2012.),该方法根据傅立叶变换对谱残差进行分析来得到人眼关注位置,计算简单但准确度不高。
目前自底向上的人眼凝视点提取方法主要问题在于图像低层特征利用的不够充分,导致计算复杂度较高且预测不够准确。本发明通过提取全局颜色特征和局部结构特征较好地表达了图像的显著特征,并通过对比度计算得到显著位置,得到了准确的人眼凝视点。
发明内容
为解决现有技术中的不足,本发明提供一种结合全局颜色与局部结构特征的人眼凝视点提取方法,解决了目前人眼凝视点提取方法计算复杂度较高且预测不够准确的问题。
为了实现上述目标,本发明采用如下技术方案:一种结合全局颜色与局部结构特征的人眼凝视点提取方法,其特征在于:包括如下步骤:
步骤1、读入当前待检测的图像;
步骤2、对待检测图像,在RGB颜色空间对图像中的所有像素颜色做均匀量化以提取全局颜色特征,基于颜色对比度在整个图像范围内计算全局显著度图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810400117.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于频域直方图特征提取的对象物状态识别方法
- 下一篇:一种显示面板和显示装置