[发明专利]一种基于多示例学习的检索方法及系统有效
| 申请号: | 201110171932.9 | 申请日: | 2011-06-16 |
| 公开(公告)号: | CN102831129A | 公开(公告)日: | 2012-12-19 |
| 发明(设计)人: | 李斐;刘汝杰;于浩;石原正树;上原祐介 | 申请(专利权)人: | 富士通株式会社 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李春晖;李德山 |
| 地址: | 日本神*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 示例 学习 检索 方法 系统 | ||
技术领域
本发明一般地涉及图像处理技术领域,尤其是一种基于多示例学习的检索方法及系统。
背景技术
随着数字图像数目的急剧增长,需要研究开发快速有效的图像检索技术。该技术可以应用于人们生活的很多方面,比如数字照片管理、在线购物、远程教育等等。
关于图像检索技术,主要包括基于文本的图像检索技术,以及基于内容的图像检索技术。其中,与基于文本的图像检索技术不同,基于内容的图像检索不是基于对图像的文字描述来建立索引,而是自动提取每幅图像的视觉内容特征,例如色彩、纹理、形状等,进而基于视觉内容特征进行索引。进行检索时,用户可以通过选择具有代表性的一幅或多幅例子图像来构造查询,然后由检索系统查找与例子图像在视觉内容特征上相似的图像。
由于区域特征更加符合人类的视觉感知,并且基于区域特征进行检索的技术通常可以获得更加令人满意的检索性能,因此基于区域特征的图像检索成为基于内容的图像检索中重要的手段。所谓基于区域特征进行检索,就是通过图像分割技术提取图像中有意义的区域,然后针对每个区域使用局部特征来描述,综合各区域特征得到图像的特征描述,基于这些特征设计检索算法完成检索。多示例学习就是一种已经被成功地应用于基于区域的图像检索的有效算法。
在基于多示例学习的图像检索中,每幅图像被看作一个包,而图像中的每个区域则被看作一个示例。数据集由一些具有类别标记的包组成,每个包中包含若干个没有类别标记的示例。多示例学习的基本出发点是:如果一个包中至少包含一个正的示例,那么这个包就被标记为正训练包;反之,如果一个包中全部是负的示例,那么这个包就被标记为负训练包。
对于负训练包而言,其中包含的示例一定是负的。但是对于正训练包而言,其中既包含正的示例也包含负的示例,而且系统不知道究竟哪些示例是正的,哪些示例是负的。因此,在多示例学习中,最重要的问题就是如何利用正训练包中的示例提供的信息进行检索。
现有技术中的算法通常使用优化的方法,试图选出正训练包中包含的正示例,这种方法至少具有以下不足:需要事先确定选出的示例数目,比如限制每个正训练包中只能选出一个正的示例,那么也只有一个示例参与最终的检索,但实际上正训练包中往往包含不止一个正的示例,只利用其中一个示例进行检索,会导致正训练包中的示例提供的信息无法得到充分的利用,限制检索的性能。
发明内容
有鉴于此,本发明实施例提供了一种基于多示例学习的检索方法及系统,能够使得正训练包中的示例提供的信息得到更为充分的利用,提高检索性能。
根据本发明实施例的一个方面,提供一种基于多示例学习的检索方法,包括:获取训练包以及训练包中的训练示例,所述训练包中包括正训练包;为所述正训练包中的每一个训练示例生成权值,该权值的绝对大小代表相应的训练示例能够反映用户查询语义的程度;针对训练包以及测试包中的所有示例,利用所述正训练包中各训练示例的权值,得到各个测试示例的排序分值;根据测试包中各个测试示例的排序分值,确定各个测试包的排序分值,并根据所述测试包的排序分值确定检索结果。
根据本发明实施例的另一个方面,提供一种基于多示例学习的检索系统,包括:获取单元,配置为获取训练包以及训练包中的训练示例,所述训练包中包括正训练包;训练示例权值生成单元,配置为为所述正训练包中的每一个训练示例生成权值,该权值的绝对大小代表相应的训练示例能够反映用户查询语义的程度;测试示例排序分值获取单元,配置为针对训练包以及测试包中的所有示例,利用所述正训练包中各训练示例的权值,得到各个测试示例的排序分值;检索结果确定单元,配置为根据测试包中各个测试示例的排序分值,确定各个测试包的排序分值,并根据所述测试包的排序分值确定检索结果。
另外,根据本发明的另一方面,还提供了一种存储介质。所述存储介质包括机器可读的程序代码,当在信息处理设备上执行所述程序代码时,所述程序代码使得所述信息处理设备执行根据本发明的上述基于多示例学习的检索方法。
此外,根据本发明的再一方面,还提供了一种程序产品。所述程序产品包括机器可执行的指令,当在信息处理设备上执行所述指令时,所述指令使得所述信息处理设备执行根据本发明的上述基于多示例学习的检索方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110171932.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:汽化混合装置
- 下一篇:一种地电位作业除锈剂喷涂装置





