[发明专利]一种图像主要目标的定位与识别方法有效
申请号: | 201410100575.0 | 申请日: | 2014-03-18 |
公开(公告)号: | CN103824067A | 公开(公告)日: | 2014-05-28 |
发明(设计)人: | 李侃;白琳;徐琛 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 主要 目标 定位 识别 方法 | ||
技术领域
本发明涉及一种图像主要目标定位与识别方法,属于数字图像处理领域。
背景技术
随着人工智能技术的不断发展,如何实现计算机自主认识周围环境、模仿人类自主理解周围世界,已成为当前以及今后很长一段时间计算机、人工智能技术的主要研究目标。实现计算机自主认识周围环境、自主理解周围世界的关键环节——实现图像主要目标定位与识别。图像主要目标是指处于原始图像中央区域内,处于较浅深度的目标。图像主要目标定位与识别技术是目前图像处理研究领域的一个热点、难点,其具有很宽广的应用前景。例如:在反恐维安等警方调查活动中,实现计算机自动发现、定位犯罪份子等。随着监控视频探头的普及与应用,越来越成为辅助警方分析犯罪活动,抓捕罪犯的有力帮手。由于监控视频拍摄的视频图像一般都几个小时,甚至几天的时长,而犯罪活动一般只有短短的几分钟。想要从冗长的视频录像中发现、定位犯罪活动的时间,分析犯罪过程,目前只能完全依靠警员长时间的观看视频录像来确定。这不仅耗费了大量的人力,而且花费时间也比较长,降低了第一时间抓捕罪犯的机率。
目前,图像主要目标定位与识别研究仍处于初期阶段。大部分的研究工作仍处于单个目标的识别与定位,并不能有效的确认图像中的主要目标。
美国伊利诺伊州大学香槟分校的Pedro F.Felzenszwalb博士和他的团队开创性的提出了轮廓模型(Deformable Part Model)较好的实现了图像中各种目标的定位与识别。开启了图像目标识别研究领域的新时代,但是轮廓模型并不能分析、定位图像的主要目标。
美国普林斯顿大学的Li.L.J博士和Fei-Fei.L博士的研究团队长期致力于图像分割与目标识别的研究工作,在数字图像的场景识别与目标定位研究中取得了很好的效果。他们通过构建联合概率模型,实现了计算机自动定位与识别图像中的各种目标,实现各种目标的简单文字标注,但是没能找出图像的主要目标。
美国卡内基.梅隆大学的A.Gupta教授领导的研究团队和美国伊利诺伊州大学香槟分校的Ali Farhadi博士的研究团队以概率模型为基础,进行了大量关于图像目标定位与识别的研究。A.Gupta教授领导的研究团队提出一种基于贝叶斯方法的概率模型,通过计算各种类型的图像中不同目标出现的概率,来提高图像中的各种目标定位与识别的准确性。Ali Farhadi博士的研究团队通过采用改进的轮廓模型,提高图像中各种目标的定位与识别的准确性。而且他们还开创性的提出了图像语言短语(Visual Phrases)来发现图像中的各种目标之间的特定关系,并通过统计的方法试图找出图像中的主要目标。
因此,需要设计一种更符合人类认知过程的、更加高效的计算机图像识别方法,实现计算机快速自动发现、定位冗长视频中包含犯罪活动或犯罪分子的关键帧。
发明内容
本发明的目的是为了提供一种图像主要目标的定位与识别方法,实现计算机快速自动发现、定位冗长视频中包含犯罪活动或犯罪分子的关键帧。
本发明的目的是通过以下技术方案实现的。
一种图像主要目标的定位与识别方法,其具体操作步骤为:
步骤一、从待识别图像中识别单体目标,操作步骤包括:
步骤1.1:轮廓模型(Deformable Part Models)集合中包含单体轮廓模型和关系轮廓模型。单体轮廓模型和关系轮廓模型均为m×n的矩阵模型,其中,m、n∈(0,300),且m、n均为正整数。依次使用轮廓模型集合中的每个单体轮廓模型对待识别图像进行步骤1.2的操作。
步骤1.2:使用当前单体轮廓模型,以逐像素的方法遍历待识别图像,将完全匹配成功的像素区域,用正好能覆盖的矩形框标记出来。
经过步骤一的操作,可以得到待识别图像中的单体目标。
步骤二、从待识别图像中识别关系目标,操作步骤包括:
步骤2.1:依据搜索关键词,从轮廓模型集合中的关系模型子集中找到含有关键词的关系模型。
步骤2.2:依次使用步骤2.1得到的关系轮廓模型对待识别图像进行步骤2.3的操作。
步骤2.3:使用当前关系轮廓模型,以逐像素的方法遍历待识别图像,将完全匹配成功的像素区域,用正好能覆盖的矩形框标记出来,得到关系目标。
经过步骤二的操作,可以得到待识别图像中的关系目标。
步骤三、确定候选主要目标区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410100575.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序