[发明专利]一种图像检索中基于文本的查询扩展与排序方法无效

专利信息
申请号: 201010184725.2 申请日: 2010-05-12
公开(公告)号: CN101901249A 公开(公告)日: 2010-12-01
发明(设计)人: 张玥杰;金城;薛向阳;岑磊;彭琳 申请(专利权)人: 复旦大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海正旦专利代理有限公司 31200 代理人: 包兆宜
地址: 20043*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 图像 检索 基于 文本 查询 扩展 排序 方法
【权利要求书】:

1.一种图像检索中基于文本的查询扩展与排序方法,其特征在于包括如下步骤:

(1)预处理与预分析

针对初始查询,通过预处理完成查询的分词与标点符号加标,并基于经过预处理的初始查询,通过预分析完成禁用词加标、词类分析与关键词提取;

(2)词语语义相似度度量

针对英语词语语义相似度度量,基于网络路径长度与深度来计算语义距离,针对汉语词语语义相似度度量,基于综合考虑主类义原相似度、语义表达式相似度与主类义原框架相似度进行计算,同时融入最大匹配规则与义原深度信息;

(3)融合扩展规则的查询扩展

基于语义网络知识,同时融合所建立的特定扩展规则,针对源于初始查询的关键词序列进行语义扩展;

(4)基于评分的检索结果排序

以搜索引擎返回的检索结果作为处理对象,基于词语语义相似度度量评估查询关键词序列与图像描述说明之间的“相近程度”,获取评分,并通过评分算法进行优化,将最终得分作为搜索引擎返回图像的排序依据。

2.根据权利要求1所述的方法,其特征在于,所述的英语词语语义相似度度量算法的原型中,建立一种基于同等词的Lesk扩展算法,进一步扩展词语语义定义,其中将同等词定义为某个词语所属同义词集合在WordNet层次结构中的兄弟结点,其中,一个同义词集合与其所对应的同等词存在一个公共父结点。

3.根据权利要求1所述的方法,其特征在于,所述的汉语词语语义相似度度量算法的原型中,以整个语义表达式为基础,按层次将义原进行划分,采用最大匹配的方法,单独考虑主类义原对于概念的直接描述能力;同时,在度量过程中,加入义原深度信息的考虑,其中的概念语义相似度分为如下三个部分计算:

Sim(C1,C2)=w1*P1+w2*P2+w3*P3

其中,P1为两个概念主类义原之间的相似度;P2为整个语义表达式之间的相似度;P3是针对两个DEF主类义原框架之间相似度的计算;w1、w2与w3分别为三个部分相似度所对应的权值,应满足约束条件w1+w2+w3=1且w2>w1,w2>w3

4.根据权利要求1所述的方法,其特征在于所述的融合扩展规则的查询扩展其算法步骤采用如下伪代码描述:

(1)获得输入:原始查询关键词序列;

(2)选择其某个关键词项;

(3)如果为英语关键词项,查找WordNet的语义网络文件,获取其同义词集Synset;

如果为汉语关键词项,查找HowNet的语义网络文件,获取其语义定义DEF;

(4)基于扩展规则,针对英语关键词项的各个Synset,根据语义网络层次结构中的部分关系,兄弟关系,以及子女关系,寻找相应的近义词词集作为扩展词集;针对汉语关键词项的各个DEF,作以直接匹配扩展;

(5)基于扩展后处理策略,根据图像库标注集信息,对扩展词集进行过滤筛选,获取优化后的最终扩展词集;

(6)重复(2)~(5),获得原始查询中每个关键词项的扩展词集进行合并,将其作为与原始查询相对应的扩展后查询表达。

5.根据权利要求1所述的方法,其特征在于,所述的基于评分的检索结果排序算法的原型中,评分算法中标注词的计算结果附加权重,用于突出图像中可能的“突出”物体;采用下述公式计算图像的排序分数:

Score=Σi=1nΣj=1mw(j,m)Sim(ki,tj)Σj=1mw(j,m)]]>

其中,ki为关键词序列的第i个关键词;tj为图像标注词序列的第j个标注词;Sim(ki,tj)用于计算两个词项ki与tj之间的语义相似度;w(j,m)为相关权重,w(j,m)=(m+1-j)2,用于突出标注序列中标注词项的前后关系;n与m分别是查询关键词序列与图像标注词序列所包含的词项个数;当图像标注词序列中的第一个标注词权重为m2,则相对于总权重其所占比例为:

m2Σj=1mw(j,m)=m2Σj=1mj2=6m2m(m+1)(2m+1)=6m(m+1)(2m+1)]]>

该函数是一个递减函数,随着图像标注词序列的增大,排头词的权重影响成线性递减。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010184725.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top