[发明专利]用于图像检索的基于流形正则化的半监督排序学习方法有效
申请号: | 201210249163.4 | 申请日: | 2012-07-18 |
公开(公告)号: | CN102831161A | 公开(公告)日: | 2012-12-19 |
发明(设计)人: | 冀中;苏育挺;井佩光 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 温国林 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 图像 检索 基于 流形 正则 监督 排序 学习方法 | ||
技术领域
本发明涉及面向多媒体信息检索领域,尤其涉及一种用于图像检索的基于流形正则化的半监督排序学习方法。
背景技术
随着信息技术的快速发展,图像和视频等多媒体资源迅速增长,图像和视频由于含有丰富、直观和有趣的信息,已成为人们获取信息的重要途径之一。如何从海量的数据中快速准确地获取用户所需的信息是一项具有挑战性的工作。现有的商业搜索引擎对图像或视频的检索主要是通过检索图像或视频所在网页的文本信息。然而,有限的文本信息并不能充分描述图像或视频的丰富内容,也不能准确描述出图像或视频与查询的相关程度。此外,文本描述与图像或视频之间可能存在着误匹配。因此,基于内容的图像或视频检索引起越来越多的关注。
基于内容的图像或视频检索是通过对图像内容进行分析,提取图像或视频的视觉特征,从数据库中查找到具有指定特征或含有特定内容的图像或视频。排序学习技术正逐渐应用到图像或视频检索中,并成为其中的核心技术。排序学习是利用排序信息结合机器学习的方法学习更有效的排序模型,其侧重点在于学习的过程。
多媒体检索相关领域数据中存在着大量排序信息。排序信息是指排序学习中的训练数据集合所提供的可用于学习排序模型的监督信息,包括数据的相关性等级信息、数据的优先级关系信息以及建立其上的关系对和关系序列等信息。利用标注信息进行图像或视频的重排序是目前主要的方法之一,标注信息可以通过人工标注、相关反馈、伪相关反馈和隐相关反馈等途径获取。其中,相关性等级信息广泛应用于信息检索的模型训练中。在大多数情况下,根据与查询的相关性高低手动地或自动地对每个文档进行不同等级的标注,例如“非常相关”、“一般相关”和“不相关”等,这些描述样本与查询相关程度的度量叫做样本的相关性等级信息。
在排序学习中存在着视觉一致性假设。视觉一致性假设是指视觉相似的图像其排序分数也应该比较接近,因此应该排在相近的位置;反之,视觉上不相似的样本不应该排在一起。一些正则化技术常常用于构建视觉一致性假设。流形正则化则是将流形学习与正则化技术相结合的一种技术。
发明人在实现本发明的过程中,发现现有技术中至少存在以下问题:
1)现有的排序学习通常是监督型,即仅仅利用标注的样本训练排序模型,并没有利用广泛存在的未标注样本,不利于检索与排序性能的进一步提升;2)半监督的排序学习方法,很少直接通过流形学习的方法引入未标注的样本或者流形学习都是基于传统的相似性测度计算,并没有在相似性计算过程中引入样本的标注信息,不利于标注信息的充分利用,使得检索精度不高。
发明内容
本发明提供了一种用于图像检索的基于流形正则化的半监督排序学习法,本发明提高了检索与排序性能,充分利用了标注信息,提高了检索精度,详见下文描述:
一种用于图像检索的基于流形正则化的半监督排序学习方法,所述方法包括以下步骤:
(1)从数据库或者初始基于文本的网络搜索结果中提取视觉特征组成图像样本集合;
(2)对所述图像样本集合按照与查询主题相关性的程度划分为三个等级2、1和0,2表示与查询非常相关,1表示一般相关,0表示不相关;
(3)计算未标注图像样本的伪相关等级信息yi;
(4)计算两个图像样本之间的距离;
(5)通过所述两个图像样本之间的距离构造拉普拉斯流形正则化项;
(6)通过所述拉普拉斯流形正则化项构造目标函数;
(7)求解所述目标函数获取各个图像样本的排序分数,把排序后的结果反馈给用户。
所述计算未标注图像样本的伪相关等级信息yi具体包括:
1)计算重构系数cij;
对未标注图像样本集合XU中的每一个图像样本xi,在标注图像样本集合XL中选择前k1近邻图像样本作为所述图像样本xi的近邻样本,所述图像样本xi由k1近邻图像样本重构所得到的重构系数cij:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210249163.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:液晶显示面板的聚酰亚胺涂布方法
- 下一篇:一种多单体串联电池组主动均衡电路
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序