[发明专利]一种图像中对象的识别方法和装置无效
申请号: | 201210526946.2 | 申请日: | 2012-12-10 |
公开(公告)号: | CN103106239A | 公开(公告)日: | 2013-05-15 |
发明(设计)人: | 宗竞 | 申请(专利权)人: | 江苏乐买到网络科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/54 |
代理公司: | 苏州威世朋知识产权代理事务所(普通合伙) 32235 | 代理人: | 杨林洁 |
地址: | 215123 江苏省苏州市苏州工*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 对象 识别 方法 装置 | ||
技术领域
本发明涉及多媒体内容的检索技术,尤其是一种图像中对象的识别方法和装置。
背景技术
随着互联网的迅速发展,基于文字信息的内容搜索技术得到了迅速发展,并且成为一项重要的网络应用,例如Google、Bing和Yahoo Search等都提供相关服务。并且,最近几年,由于移动电话、照相机和摄像机的广泛应用,越来越多的多媒体内容被产生出来,并存储在个人计算机或网站上。对这些多媒体内容进行检索进而进行相关利用成为一项重要课题。
因而,多媒体内容的检索技术受到了越来越多的关注。但是,现有的多媒体内容搜索或检索系统,例如Google image、video searching、Flickr、Bing image或video searching以及Youtube等都完全依赖于用户输入的文字查询条件。用户输入检索文字(例如关键字),系统通过将所述检索文字与多媒体内容的标题、注解或者周围文字进行文字匹配而进行多媒体内容的搜索。并且,有些现有技术用于从多媒体内容中直接提取信息,例如从多媒体内容中寻找对象、事件或者其他信息。这种信息还可以用于进一步的多媒体搜索或者内容索引等。
基于模型的对象识别是最常用的在图像中搜寻对象的方法。在这种方法中,构建3D对象模型并将其投射至2D空间以形成图像模型。随后,利用特定对象的整体外观作为模型与模型数据库中的模型进行外形匹配,进而发现图像中的特定对象。
但是,为了准确判断图像中存在的对象,上述的模型数据库需要包括充足的对象模型或者对象零件模型,这种要求很难实现并且成本很高。另外,即使具有满足要求的模型数据库,由于上述的匹配过程需要对模型数据库中的全部模型进行操作,因此需要大量计算。
因此,需要一种效率更高的图像中对象的识别技术。
发明内容
根据本发明的一个方面,提供了一种图像中对象的识别方法,包括下述步骤:从图像的上下文信息中提取名词实体以获取图像中可能对象的概念表示;和利用所述概念表示对所述对象模型数据库进行匹配操作以识别所述图像中存在的相关对象。
其中,所述图像的上下文信息包括图像的题目、注解和图像周围的文字。
其中,所述概念表示是所述上下文信息的一组认知近义词。
其中,通过对所述概念表示进行语义扩展和推导得出所述一组认知近义词。
所述方法还可以包括,将所述匹配操作中得出的与图像的概念表示相匹配的对象模型数据库中的模型与所述图像进行低层次特征匹配以识别图像中的对象。
所述方法还可以包括,在提取所述图像的上下文信息的名词实体之前,对所述图像进行预处理。
其中,所述预处理包括噪声抑制、边界检测和低层次特征提取。
其中,采用自然语言处理从图像的上下文信息中提取名词实体以获取图像中可能对象的概念表示。
根据本发明的另一方面,提供了一种图像中对象的识别装置,包括:从图像的上下文信息中提取名词实体以获取图像中可能对象的概念表示的装置;和利用所述概念表示对所述对象模型数据库进行匹配操作以识别所述图像中存在的相关对象的装置。
附图说明
图1是根据本发明实施方式的图像中对象识别的方法的流程图;和
图2是根据本发明实施方式的图像中对象识别的装置的框图。
具体实施方式
下面对参考附图对本发明的图像中对象的识别方法方法和装置的优选实施例进行详细的描述,需要注意的是,下面的描述仅是示意性的,其中所涉及的内容并不构成对发明所涉及内容的限制,本领域技术人员在下面公开内容的基础上还可以有许多不同的变化方式,这些都属于本发明的保护范围。
下面以基于模型的图像中对象识别为例对本发明的实施方式进行详细说明。
在现有的基于模型的图像中对象识别方法中,首先要建立一个对象模型数据库,该数据库用于识别和定位图像中的特定对象。可以利用现有技术对象模型数据库的建立,例如3D投射等。并且,通常是以离线方式建立所述对象模型数据库。对象模型数据库的作用是为图像中的对象识别提供所需对象的形状的全面信息。对象模型数据库的建立可以通过各种现有技术来实现。并且,本发明的重点并不在于该数据库的建立,因此在本发明中不再进行进一步的详细描述。
对图像首先进行预处理,例如噪声抑制、边界检测和低层次特征提取等。然后,基于对象模型数据库中的模型,对图像进行匹配操作,即可发现图像中存在何种对象。但是,如上所述,该匹配操作需要大量计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏乐买到网络科技有限公司,未经江苏乐买到网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210526946.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序