[发明专利]一种推断图像中主题和场景的方法无效
申请号: | 200810025379.6 | 申请日: | 2008-04-30 |
公开(公告)号: | CN101571856A | 公开(公告)日: | 2009-11-04 |
发明(设计)人: | 沈晋文;雷晓军 | 申请(专利权)人: | 福特安(苏州)图像管理有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/00 |
代理公司: | 南京苏科专利代理有限责任公司 | 代理人: | 陈忠辉;姚姣阳 |
地址: | 215021江苏省苏州市工业*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 推断 图像 主题 场景 方法 | ||
技术领域
本发明涉及一种图像的归类推断方法,尤其涉及一种推断图像中主题和场景的方法。
背景技术
一张图片相当于上千个文字。图片携带多层知识并讲述许多故事。这种意义下,它是人类创建的内容最为丰富的媒介之一。图像创建人(假定:一名摄影师)非常容易将许多内容嵌入一个或一系列图片中,但是如何以视觉格式以外的语义或逻辑格式系统表示此类内容,并将其转换成其他人可以综合并利用的重要知识,证明相当困难。
任何人能够使用图像中携带的内容或知识之前,必须能够有方法从可能包含无数图像的系统中搜索并检索该图像。大规模的图像搜索根据其内容搜索图像,不需参照图像周围的文本信息。此类详尽的文本信息可能是:图像文件名称、URL路径、图像上出现的正文、与图像相同页上出现的正文等等。为了进行内容图像搜索(CBIS),图像上的内容进入系统的时候或之后,搜索系统必须首先识别或“理解”图像上的内容。识别程序期间,图像上的内容从其本来的视觉表示转换成系统能够用来执行搜索的逻辑表示(通过索引或查询配对等知名的途径)。典型的图像逻辑表示可以是一种口头的描述、一列关键词、图像中确认目标及其关系。大概来说,逻辑表示可以归类为语义信息和空间信息。由于用户可以便利地使用关键词或自然语言作为检索位置图像的输入信息,所以关键词或自然语言形式的语义信息受到特别偏爱,使用另一种图像作为输入则相反。
多数此类系统将图像视为一个整体并根据其颜色和结构努力“理解”并记住图像,且不会明确识别图像中的独立目标。这种情况下,从图像中获取的逻辑信息价值则非常有限。许多系统确实努力识别单独目标,但是,大多数的识别努力集中在图像中已知的符号且目标之间的关系被忽视。所以,始终存在着高度的信息盲点,导致不可能进一步将提取的信息综合入形成内容图像搜索系统最有价值基础的有用信息。
捕捉图像内容或知识的通用方法是采用一种智能代理(IA)检查图像并生出一列关键词或标记符。此类IA可以是人类或机械工具、或者是两者的结合。现有商业系统采用这种方法。但是,这种方法既没有知道选择关键词和标记符的标准,也没有考虑到保留这些关键词之间的关系,具有严重的缺陷。所以,内容或知识捕捉过程中再次有着高度的信息盲点,同时根据此类粗略信息形成的知识体对用户也没有多大的价值。
为了便于处理,可以采用智能代理根据图像内容以自然语言建立详尽的叙述性图像描述;但是,正如我们前面所声明的:“一张图片相当于上千个文字。”如果叙述性描述足够全面,其可以很容易地形成成千上万的文字或句子。因此,需要采用最少的文字和最贴切的表达,对图像进行主题和场景推断。
发明内容
本发明的目的就是为了解决现有技术中存在的上述问题,提供一种推断图像中主题和场景的方法。
本发明的目的通过以下技术方案来实现:
一种推断图像中主题和场景的方法,其中:该方法采用人工知识结构作为智能代理所用的导轨网络,从接收到的图像中识别相关目标及相关目标周围的知识元素,推断出图像的主题和场景,将图像的主题和场景归类在人工知识结构内的人工知识基础中
上述的一种推断图像中主题和场景的方法,其中:所述的智能代理,经人工知识结构控制,首先识别图像中具有重大意义的第一个目标,即:
步骤一:设第一个目标表示为O1,P1表示相关关键知识元素,K1(K1=k11,k12,k13,k14……)表示人工知识结构上现有的矢量节点,结合人工知识结构,与K1直接相互连接的节点(K2、K3……)与概率(P2、P3……)中的其它目标(O2、O3……)有关,搜索次序取决于概率p1-2、p1-3、p2-3……,最高概率的节点首先进行识别;随后人工知识结构促使智能代理集中于搜索图像中的其它目标(O2、O3……),只有在其它目标(O2、O3……)不能发现某些确信等级时,智能代理才能够寻找新的其他目标;
步骤二:若概率p1-2,、p1-3、p2-3……足够接近搜索指令的优先权,则进一步重新定义上述程序,即检查K1的组成部分:k11、k12、k13、k14……,并计算p1-2(x:k11,x:k12,x:k13,x:k14……)、p1-3(x:k11,x:k12,x:k13,x:k14……)、p2-3(x:k11,x:k12,x:k13,x:k14……)的条件概率,得到新的目标搜索方向;
步骤三:通过马克可夫程序推断O1、O2、O3等外观次序,同时与O1、O2、O3相关的K1、K2、K3进行综合,建立主题和/或场景。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福特安(苏州)图像管理有限公司,未经福特安(苏州)图像管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810025379.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:可携式电脑装置的防盗方法与系统
- 下一篇:数字板切换工作区域比例的方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序